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出版说明 


由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法. 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是: 《线性回归分析基 
础》、《高级回归分析》、《广义线性模型》、《纵贯数据分析》、 
《因果关系模型》、《社会科学中的数理基础及应用》、《数据分 
析方法五种》和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎，他们针 
对丛书的内容和翻译都提出了很多中肯的建议。我们对此 
表示衷心的感谢。 

基于读者的热烈反馈，同时也为了向广大读者提供更多 
的方便和选择，我们将该丛书以单行本的形式再次出版发行。 
在此过程中，主编和译者对已出版的书做了必要的修订和校 
正，还新增加了两个品种。此外，曾东林、许多多、范新光、李 
忠路协助主编参加了校订。今后我们将继续与 SAGE 出版社 
合作，陆续推出新的品种。我们希望本丛书单行本的出版能 
为推动国内社会科学定量研究的教学和研究作出一点贡献。 




总序 


往事如烟，光阴如梭。转眼间，出国已然十年有余。 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问题。以我以前在国内所受 
的学术训练，基本是看不上定量研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。’国内一位老师的 
话给我的印象很深，大致是说 :如果 你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竟是几度吗？所 
以，很多研究都是大而化之，只要说得通即可。另一方面， 
国内（十年前）的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定量研 
究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 




2 


定序因变量的 logistic 回归模型 


究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调查数据分析”，第三门叫“研究设计”。除此 
以外，还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修。2001年完 
成博士学业之后，我又受安德鲁 • 梅隆基金会资助，在世界 
定量社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 (Institute for Social Research ) 定量社会研究方 
法项目的一些讨论会，受益良多。 

2003年，我赴港工作，在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学 ” （Statistics for Social 
Science ) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课(事实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课)。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
例子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后，我们一方面能 
够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的 文章; 另一方面，也能在自己的研究中运用这些成熟的 



方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学 ” (Statistics 
for Social Science ) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性回归模 
型，以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
的分析模型上，包括两分类的 logistic 回归模型、多分类 lo ¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归 
模型、多维列联表的对数线性和对数乘积模型、有关删节 
数据的模型、纵贯数据的分析模型，包括追踪研究和事件 
史的分析方法。这些模型在社会科学研究中有着更加广 
泛的应用。 

修读过这些课程的香港科技大学的研究生，一直鼓励和 
支持我将两门课的讲稿结集出版，并帮助我将原来的英文课 
程讲稿译成了中文。但是，由于种种原因，这两本书拖了四 
年多还没有完成。世界著名的出版社 SAGE 的“定量社会科 
学研究”丛书闻名遐迩，每本书都写得通俗 易懂。 中山大学 
马骏教授向格致出版社何元龙社长推荐了这套书，当格致出 
版社向我提出从这套丛书中精选一批翻译，以繪中文读者 
时，我非常支持这个想法，因为这从某种程度上弥补了我的 
教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种 



4 


定序因变童的 logistk 回归横型 


语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜任的。在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士研究生。 
他 们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智 
明、叶华、张卓妮、郑冰岛，硕士研究生贺光烨、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊，应用社会经济研究中心研究 
员李 俊秀; 香港大学教育学院博士研究生洪 岩璧; 北京大学 
社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系 
讲师巫 锡炜； 中国台湾“中央”研究院社会学所助理研究员林 
宗弘; 南京师范大学心理学系副教授陈陈;美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜 念涛; 美国加州大学 
洛杉肌分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异，校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
曦、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外， 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 



我也致以诚挚的谢意。有些作者，如香港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 
工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 


吴晓刚 

于香港九龙清水湾 



序 




在过去60年中， logit 模型已经成为社会科学中最流行的 
统计方法。自从伦西斯 • 利克特 (Rensis Likert ) 1932年出版 
《态度测量的方法 》 (A Technique for the Measurement of Atti¬ 
tudes) 以来，人们对人类态度的测量方法一直都在变化着。实 
际上，今天的任何社会调查都已将李克特类型的量表作为一 
种主要的方法。一个典型的李克特量表有五个类别(例如，非 
常不同意、同意、不知道、同意、非常同意)，用以测量个体对问 
题的响应，尽管它在别的地方也许还有三到七个或更多的响 
应类别。如果我们将五个类别编码为从1到5,那么我们可以 
用线性回归模型来估计李克特量表，这也是早些时候分析这 
样的数据时所采用的方法。然而，这种方法也存在诸多明显 
的问题。首先，经典线性回归假设连续因变量是距离相等的 
定序因变量类别 (ordered response categories )。 一 个李克特类 
型的量表，或者任何其他的定序量表，虽然是定序的，但并不 
一定在类别间等距。其次，也许是更重要的，这样的量表所得 
出的分布不是经典线性回归所假定的数据呈现的正态分布。 

为了分析定序数据的这种属性，也有其他的方法，经常 
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使用的是列联表和对数线性模型的形式，具体可以 参见: 《定 
序数据分析》 (如 o / Ordinal Data )， 作者海德普兰德、 
莱恩和罗森塔尔 （ Hiderbrand ， Laing , Rosenthal ) ;《对数线性 
模型》 （ Log-linear Models ) ，作者诺克和伯克 （ Knoke , 
Burke ) ;《潜变量的对数线性模型 》 （Log linear Models With 
Latent Variables ) ，作者哈根纳斯 （ Hagenaars ); 《定序对数线 
性模型 》 (OrviiTKiZ Log-Linear Models ) ，作者石井坤茨 （ Ishii - 
Kuntz ) ;《列联表分析中的比数比》 ( CWc ? 5 Ratios in the Anal ¬ 
ysis of Contingency Tables ) ，作者鲁达斯 （ Rudas ) 。然而，这 
些方法都不在回归的框架下，而回归方法正是社会科学中广 
为人知且被广泛应用的量化方法。 

安 • A •奥康奈尔的这本书填补了空白。即使有的著作 
也将定序因变量变量在 logit 模型中加以处理，但本书则完全 
通过呈现三种形式的因变量来集中关注该类 logit 模型，这些 
因变量抓住了响应的定序本质。本书以展示来自儿童早期 
追踪研究的实例开始，其中的主要因变量虽然不是李克特量 
表，但其对早期读写和算术熟练度的测量还是定序的。作者 
进而回顾了 logistic 回归，并接着呈 ia 三个核心主题章 节：累 
积或比例比数模型 （cumulative or proportional odds model ), 
连续比例模型 （continuation ratio model ) 以及相邻类别模型 
(adjacent categories model ) 。与此同时，书中给出了 SAS ® 和 
SPSS ® 的案例。尽管比例比数模型也许是三种方法中最常 
用的,但在结论部分，读者可以领会到关于替代方法尤其是 
什么时候使用替代方法的提示。 


瘳福挺 
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对+很多在教育和社会科学中的因变量，定序尺度提供 
了一种将可能的结果区分开来的简单且便捷的方法,而这些 
可能结果最好被看成是等级定序的 （ rank - orderd )。 定序数 
据的主要特点，是指定给所测量变量的相继类别的数字代表 
的量级上的差异，或者“大于”或者“小于”的性质 （ Stevens ， 
1946, 1951)。一些定序数据的例子包括 :对开 放式答案或文 
字进行编码的一类题目，以及解决以能力改善为基础的答案 
的计算方案(例如，0 =差，1 =可以接受，2 =优秀)。对比之 
下，名义水平的数据发生在数值用于通过认定类别之间简单 
的质的差别来测量一个变量的情况(例如，1 =男性，或者2 = 
女性; 所在学校的地理位置描述 :1 =乡村，2 =城市,3 =郊 
区，等 等); 名义变量没有定序数据的方向特征。另一方面，在 
定距或者定比水平尺度上测量的变量的确使用了表明定序数 
据“大于”或者“小于”属性的尺度值，但还保持了在尺度间相 
邻值距离均等或者间隔均等长度的属性。以摄氏尺度测量的 
温度是我们熟知的定距水平变量的例子。然而，定距水平的 
变量的零点相对主观，而非绝对。拥有所有定距尺度属性但 
也有真实零点的变量，被称为定比水平。例如，对一项任务 
的反应时间、重量以及距离等是熟悉的定比水平的变量。 [1] 
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定序类别在将数字指派为代表贡献、建构或者行为的相 
继类别且有方向意义上的差异的研究情境下很常见。纳普 
( Knapp , 1999) 使用定序评级法，通过划分轻微的（1)、适中 
的(2)、严重的 (3) 尺度类别来评估疾病的严重程度。在纳普 
的研究中，归于疾病严重度类别的数字代表了逐渐增加的严 
重度，在这个意义上，“适中”比“轻微”更严重，而“严重”比 
“适中”更严重。賦予“严重”案例的数值并不是说“严重”是 
“轻微”的三倍严重程度，而是说“严重”的疾病严重度比“轻 
微”类别的疾病严重度要大，也比“适中’’类别的那些要大。 

用来代表进度上更严重的类别的数字选择很方便地保留 
了定义类别本身的“大于”或者“小于”的隐含属性。数字是对 
研究的属性进行建模，例如疾病的严重程度，并被用来保留类 
别的传 递性; 如果值⑶代表着比值⑵严重得多的状态，而值 
(2) 又代表着比值 (1) 严重得多的状态，那么传递性的特征意 
味着值⑶代表的状态比值⑴代表的状态要严重得多 (Cliff &■ 
Keats , 2003； Krantz , Luce，Suppes &■ Tversky , 1971)。 

对定序尺度变量的测量是类似的。定序尺度在咨询服 
务和精神疗法中已经用于主观的概率或者可能性的判断中 
(例如，对从1 = “非常不可能”到5 = “非常可能”进行评分） 
( Ness , 1995)。一个客户在经过治疗后的临床表现可以归类 
为 :恶化 (1)、没有变化(2)、改善 （3) ( Grissom ， 1994)。健康 
研究者经常使用五级尺度来描述健康相关行为的“改变阶 
段”，例如，戒烟、使用避孕套、运动行为、减肥努力 （Hedeker 
8*- Mermelstein , 1998； Plotnikoff , Blanchard , Hotz &- 
Rhodes , 2001 ； Prochaska &- DiClemente , 1983, 1986； 
Prochaska , DiClemente &- Norcross , 1992)。 在改变阶段模 



4 I 定序 B 变置的 logistic 回归棋型 

型中，朝着行为改变的意向或者行为通常通过以下阶段来测 
量：（1)意图前期（ precontemplation ) ； ( 2 ) 意图期 （ contempla ¬ 
tion ) ； (3) 准备期 ( preparation ) ; (4) 行动期 （ action ) 和 （5) 维 
持期 ( maintenance ) 。教师对在他们的教室里所实施的教育 
改革的关注体验也通过定序尺度来测量，它代表了关注的焦 
点从 1( 自身）到 7( 他人 ）（Hall Hordes , 1984; van den 
Berg , Sleegers , Geijsel &• Vandeberghe , 2000)。 在童年早 
期教育中，早期读写能力的层次体的掌握指标会影响青少年 
儿童的读写熟练度，本质上可以通过定序来归类： （1) 语音语 
韵觉识 (phonemic awareness ) ; (2) 发音 （ phonics ) ; (3) 流利 
阅读 （ fluency ); (4) 词汇 （ vocabulary ); (5) 文本理解 （text 
comprehensive ) (早期阅读能力改善中心 ， Center for the Im ¬ 
provement of Early Reading Achievement , CIERA , 2000) 。 

尽管定序结果可以是简单且有意义的，但对它们进行理 
想的统计处理对很多实证研究者而言仍然是一项挑战 
(Cliff，1996a； Clogg Shihadeh, 1994； Ishii-Kuntz, 1994)。 
历史上，研究者对定序结果的分析依赖于两种非常不同的方 
法。一些研究者选择使用定序结果的参数模型，例如通过将 
定序结果作为至少定距水平的变量的多元线性回归，假设这 
些方法的稳健性克服了任何可能的解释问题。其他的研究 
者选择将定序变量严格地当做类别变量对待，并运用对数线 
性或非参数方法来理解数据。尽管两种策略在研究问题的 
基础上都能够说明问题，但它们都不是发展出定序结果的解 
释模型的最佳方法 （Agresti， 1989； Cliff, 1996a； Clogg &- 
Shihadeh, 1994； O'Connell, 2000) ，尤其是当分析的焦点是 
在这些定序分数的区分方面时。 



本书的目的是让实证研究者熟悉，尤其是让那些在教育 
和社会科学及行为科学领域的研究者们熟悉，忠实于结果测 
量实际水平的定序因变量的替代分析方法。本书讨论的例 
子是定序回归模型，它们是对二分响应数据的 logistic 模型 
的拓展。 logistic 回归方法是在流行病学、医学和相关领域内 
稳固发展起来的，实际上，最近关于定序回归技术应用和发 
展的文献也大都出现在公共卫生研究领域内。很多这类统 
计或者比较研究的结果会在这里提到。教育和社会科学家 
通常也许不关注类似于流行病学或者医学研究者研究的变 
量，但是困扰这两个领域的模型的适用性问题，其大部分都 
可以从更广泛的统计文献中应用不同方法解决统计难题中 
了解到。 

本书将呈现分析定序结果数据的三种方法，并通过例子 
进行描述。这些方法包括比例或累积比数模型 (Proportional 
or Cumulative Odds model , 以下简称 CO ) ( Agresti , 1996; 
Armstrong &- Sloan , 1989； Long , 1997； McCullagh , 1980)、 
连续比例模型 （Continuation Ratio model ，以下简称 CR ) 
(Armstrong &. Sloan , 1989; D . R Cox , 1972; Greenland , 
1994) 以及相邻类别模型 （Adjacent Categories model , 以下简 
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称 AC )( Agresti ， 1989； Goodman , 1983)。 此外，作者呈现了 
偏比例比数的例子 (Peterson & Harrell , 1990)，并讨论了偏 
比例风险或者未约束的连续比数模型 （Bender Benner , 
2000； Cole & Ananth , 2001) 作为比例比数或者连续比例模 
型的假设被违背情况下的替代 分析。 

定序 logit 模型可以看做二分结果的 logistic 回归的扩 
展，相应地，这些模型密切遵循 logistic 和普通最小二乘回归 
分析的方法和模型建构策略。作者决定关注定序结果的 
logit 模型，是因为从这些模型中得到的概率和比数的解释较 
为直观。例如，这里呈现的方法的替代，包括安德森 ( Ander ¬ 
son ， 1984) 的定型模型 （stereotype model) 、 probit 回归模型， 
以及定序结果变量的结构方程模型的多分格相关 (polychoric 
correlation ) 的应用。这些和其他定序数据分析的策略在 
Huynh ( 2002 ) 、 Borooah ( 2002 ) 、 Ishii-Kuntz (1994 )、 Liao 
(1994)、 Menard (1995) 以及 J&reskog 和 S 6 rbom (1996) 的研 
究中都可以 看到； 大体上，关于定序变量的处理可以 参考： 
Long (1997 )、 Clogg Shihadeh (1994) 和 Agresti ( 1989, 
1996) 的论著。 

尽管累积比数模型是最常用的定序回归模型，但本书所 
考察的对于许多实证研究者，尤其是教育科学领域的研究者 
来说仍然显得陌生。作者所回顾的各个模型能够解决存在 
于定序结果研究中的独特问题，且这些问题通过将数据作为 
定距/定比或者严格的分类数据时并不能得到满意的结果。 
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这里使用 SAS ® 和 SPSS ® 统计软件来描述例子。在各个 
软件里，作者使用 SAS PROC LOGISTIC (升序或者降序选 
项 ）， SAS PROC GENMOD , SAS PROC CATMOD , SPSS 
LOGISTIC REGRESSION , 以及 SPSS PLUM 来运行不同的 
例子。本书的附录包括各个分析的句法，这些句法和数据都 
可以在作者的网站上找到： http :// faculty , education , uconn . 
edu / epsy / aconnell / index , htm ® 。全书在必要的时候将会注 
明各种统计软件的局限、类似之处和差异。这里呈现的所有 
分析都假设儿童之间的独立。在本书最后一章，作者简要讨 
论了多层次数据的定序因变量的变量处理方法，这是一个迅 
速增长的领域，它由单层次数据的比例比数模型和一般多层 
次模型研究逻辑扩展而来。 

作者在本书中主要使用 SAS 和 SPSS 来描述定序 logit 
模型的概念和程序。另一个分类数据分析的全面的统计软 
件包，也包括定序数据分析的优秀模块是 State (Long & 
Freese , 2003)。 Stata 也包括能够促进对这里呈现的模型的 
进一步理解的做图能力。不论选择何种统计软件，本书中的 
模型描述都是适用的。 

①至翻译完成时该链接已失效，需要数据的读者可以向译者或者出版社电邮索 
取。——译者注 
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第 3 节 I 本电结构 


第2章描述了本书分析所使用的数据集。第3章包括 
对 logistic 回归分析的概要回顾，澄清了对于理解 logit 类型 
的定序回归模型而言相当重要的术语，这些术语 包括： 比数 
( odds ) 、比数比 （ odds ratios) 、 logits 以及模型拟合 （model 
fit )。 基于它们与 logistic 回归模型概念上的类似性，第4章 
到第6章依次描述了三个定序模型 ( CO 、 CR 和 AC )。 对于 
这里呈现的每一个定序模型，都会解释模型和变量作用，并 
讨论模型拟合的评估和预测效率。第4章提供了与一般最 
小二乘多元回归之间的比较。最后，第7章回顾并概述了这 
里所研究的分析，并讨论了这些模型的一些扩展。各个分析 
的一些电脑输出也将包括在内。 

本书中的数据都来自于儿童早期追踪研究——幼儿园 
同期群 （Early Childhood Longitudinal Study-Kindergarten 
Cohort , ECLS - K )， 该研究跟踪了代表全国样本的幼儿园儿 
童的早期阅读和算术的进步情况，直到一年级结束(三年级 
的数据在2004年3月开放）。这里分析的数据是进人一年 
级时候的。 ECLS - K 数据是由美国国家教育统计中心 
( NCES ) 执行的，也评估了学生早期读写、算术以及综合知识 
能力的熟练度，作为“石阶” （ stepping - stones ) 系列的一部分， 
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能够反映形成今后学习基础的定序能力 （ West , Denton &- 
Germino - Hausken , 2000)。 所有的可供公众使用的一年级 
数据库都可以从 NCES 处得到。 M 这里描述的例子推导仅是 
为了阐明定序回归模型的技术和方法使用的目的，并不是为 
了提供关于一年级儿童早期阅读成就的完整画面。有关儿 
童早期阅读的影响因素的更多信息，可以参见例如斯诺、伯 
恩斯及格里芬的著作 ( Snow，Burns &- Griffin , 1998)。 
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第 1 节 I 儿童早期追踪研究概述 


儿童早期追踪研究提供了一个一年级儿童的完整画面， 
包括他们的幼儿园经历、早期家庭经历及其老师和学校。 
ECLS-K 数据考察了识字、阅读以及算术能力。它包括一套 
对项目反应理论 （Item-Response Theory, IRT) 尺度的认知 
评估系列，是在全国层面样本学校的近两万名儿童中进行 
的。除了常模参照的连续 CRT 测量， ECLS-K 还包括标准参 
照学生的识字和算术熟练度，它通过学生对一系列问题群 
(包括五组、每组四道题目）的回答，来反映作为后续阅读和 
数学学习的基础。所得的结果分数可以用来在个体层次上 
对学生进行诊断，并找出针对个体的干预方向，在群体层次 
上，也可以用来建议针对处于不同熟练度层次的学生的可能 
干预方式。本书中所讨论的分析将集中在表示读写熟练度 
的标准参照分数上。 

ECLS-K 评估工具中所呈现的早期读写熟练度的类别与 
已被界定的阅读熟练度的基石 (building blocks) —致: 语音语 
韵觉识理解代表口语发音的字母、发音(理解字母组合的发 
音）、流利阅读、词汇、文本理解 (CIERA， 2001)。隐含在读写 
发展背后的技能是有层级且互相依 赖的; 稍后的技能在之前 
的技能未得到发展之前是不大可能实现的。表 2. 1描述了 
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ECLS - K 所使用的熟练度类别。 


表 2. 1 ECXS-K 对早期读写测 ■[的 熟练度类别 


熟练度类别 

描 述 

0 

没有通过1级 

1 

能够认清大小写字母 

2 

能够将字母与单词开头的发音联系起来 

3 

能够将字母与单词末尾的发音联系起来 

4 

能够识别常见单词 

5 

能够阅读文本中的单词 


资料来 源:美 国国家教育统计中心 (NCES， 2002)。 


充分回答代表各个类别的题项群的能力被假设为服从 
古特曼模型 （ Guttman ， 1954； NCES , 2000, 2002); 也就是 
说,掌握了一个层次即默认为掌握了所有之前的层次。在 
ECLS-K 评估中，样本中的每个儿童都在各个题项群上得到 
一个通过或者失败的分数，这些题项群代表了熟练度水平 
(从1到 5), 直到该儿童未能通过某题项群中四个问题中的 
三个。 [3] 对一个水平的掌握表明对所有之前水平的 掌握; 一 
旦儿童不能成功通过某题项群，则测试中止。 [4] 因此，在 
ECLS-K 数据库中阅读熟练度有五个二分变量 （ C 3 RRPRF 1 
到 C 3 RRPRF 5)。 例如，如果一个儿童填过了读写水平1中 
四个问题中的三个和读写水平2中四个问题中的三个，则该 
儿童的 C 3 RRPRF 1 和 C 3 RRPRF 2 将会得到为1的值。如果 
还是该儿童，未能通过下一题项群(读写水平 3) 中四个问题 
中的三个，则 C 3 RRPRF 3 为0,后续的水平也为0。在本书的 
例子中，用五个表明熟练程度的二分变量来产生一个反映儿 
童对内容掌握情况的定序尺度的变量。在重新编码以获得 
一个定序变量后，假定一个学生得到表明他熟练程度的分值 
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为2,则表明他对内容的掌握已经达到2级。以这种方式，在 
ECLS - K 样本中的每个儿童都得到一个单独的变量 （ pro - 
fread ) 以评估读写熟练度，该变量有六个可能的结果类别(从 
0级到5级)。该定序尺度得分为0时，表示该儿童没有取得 
代表熟练度1级的题项群的掌握程度。 [5] 
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第2节 | 定序结果的实际重要性 


定序熟练度分数可以为研究者和教育学家揭示儿童在 
继续他们的小学求学过程中，在通往完全掌握读写能力的路 
上还有多远。将定序熟练度分数而非连续 IRT 尺度分数作 
为分析的兴趣变量，强调了熟练度评估在识别和选择学生以 
进行早期干预项目中所扮演的角色。这些分析可以给出一 
些在需要个性化的干预以满足特定学生需求的具体领域的 
建议。定序熟练度结果实际上是通常的定序变量，就它们把 
干预导向特定层次的熟练度方面而言，有着巨大的实用价 
值。对于班级中的老师或者阅读专家，熟练度分数也许比知 
道儿童的认知评估的 IRT 尺度分数为55分更有价值，也更 
具可解释性。根据班级或者学校的实际制定政策进行的干 
预，将会与成功获得读写技能的石阶相关联，对于个体的学 
生也比那些急于改善全局认知测试分数（基于教室、学校或 
者区的层次)的尝试更有效。 


定序 S 变董的 logistk 回归槿型 


第3节 | 模型中的变置 

，啊 _«t— a—aaMia — aBHBHHIBSSSM 


这里展示的分析中被选为解释变量与幼童的早期阅读 
能力相关联。 ECLS - 幼儿园同期群的初始数据概要表 明:一 
些儿童在进入幼儿园时确实做了更多的学习准备，这使得他 
们在早期的学习阶段比同龄人更先一步 （ NCES ， 2000)。 
ECLS - K 研究已经展示了那些有着某些特征的人园儿童(生 
活在单亲家庭、生活在接受福利金或者食物券的家庭、母亲 
的教育水平低于高中，或者父母的主要语言不是英语)倾向 
于处于低的阅读技能风险中 (Zill West , 2001)。与家庭相 
关的入园前的经历(如有父母为其阅读)，进入学前班或者得 
到日间看护，以及个人特征（如性别）等，都与儿童在阅读中 
的初始熟练度相关，也与幼儿园及之后年级中儿童在技能和 
能力上的潜在增长相关。例如，通常入园的女孩比男孩具备 
稍好一些的阅读能力。关于儿童早期阅读成功失败的解释 
变量对于理解个体儿童如何处于阅读困难的问题有帮助。 
从政策和实践的角度看，很明显需要教师、学校当局、父母以 
及其他利益相关者意识到这些与早期熟练度相关的个体因 
素，从而发展出并支持能够促进所有儿童取得相对于他们一 
年级和入园时的技能更大成就的课程设置和教学实践。 

关于解释变量的描述性统计结果在表 2. 2中给出。它 
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们包括(性别），以男性的％呈现 (0 =女性，1 =男 
性），(家庭危险因素个数，从0到4,包括住在单亲住 
户、住在接受福利金或食物券的家庭、母亲的教育低于高中， 
或者父母的主要语言不是英语）， / amrid (表明家庭危险是 
否出现的二分变量，0为无，1为有或者说 risknum 大于等于 
l )，# rm ^6 o ( 在入园前经常有父母为其阅读书籍，从1到4 
打分，1 =从不，4 =每天）， norea 办 0( 二分变量，0表示父母 
为其阅读的频率从每周三次或以上到每天都会，1表示每周 
阅读不到1次或者2次)， AaZ / da 喊(儿童上的是半天还是全 


表 2. 2进入一年级时的描述统计 , JV = 3365 




Reading Proficiency Level(profread) 



0 

1 

2 

3 

4 

5 

Total 


(n = 

(n — 

(n = 

(n = 

(n = 

(« = 

(N = 


67) 

278) 

594) 

1482) 

587) 

357) 

3365) 

% prof read 

2.0% 

8.3% 

17.7% 

44.0% 

17.4% 

10.6% 

100% 

%male 

71.6% 

58.6% 

53.9% 

49.6% 

43.6% 

42,3% 

49.7% 

risknum 








M 

0.97 

0.77 

0.65 

0.44 

0. 32 

0.25 

0.47 

(SD) 

(1.04) 

(0. 88) 

(0.88) 

(0. 71) 

(0.61) 

(0. 53) 

(0. 75) 

%famrisk 

58.2% 

52.9% 

43.8% 

32.5% 

25.9% 

20.7% 

34.3% 

%noreadbo 

38.8% 

27. 0% 

21.7% 

15.5% 

13.1% 

7.6% 

16.7% 

%halfdayK 

43.3% 

41.7% 

46.3% 

48.0% 

40.7% 

43.7% 

45.3% 

%center 

71.6% 

73.7% 

71.0% 

77.5% 

78.7% 

84.9% 

76.9% 

Yominority 

59.7% 

58.3% 

48.5% 

33.3% 

34.2% 

33.9% 

38.8% 

uksesl 








M 

-0. 6133 

-0. 2705 

-0.1234 

0.149 

0. 2807 

0. 6148 

0.1235 

(SD) 

(0. 67) 

(0. 64) 

(0.71) 

(0. 75) 

(0. 70) 

(0. 75) 

(0. 76) 

plageent 








M 

65.6 

65.1 

65.5 

66.1 

66.5 

67.1 

66.1 

(SD) 

(4. 40) 

(4. 34) 

(3. 97) 

(4.00) 

(4. 07) 

(3. 86) 

(4. 06) 

Yq public 

98.5% 

93.5% 

86.9% 

76.7% 

70.9% 

61.9% 

77.7% 
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定序因变置的 hW»ic 回归横型 


天的幼儿园，0 =否，即全天幼儿园，1 =是，即半天幼儿园）， 
人园前儿童是否上过基于中心的日间看护，0 =否，1 
=是）， minority (少数族裔，0 =白人/高加索背景;1 =少数 
族裔或任何其他的背景），(人园之前的家庭社会经济 
地位，连续尺度分数，均值为 0), 以及 Wageerzt (入园时儿童 
的年龄月数）。另外一个变量，(儿童所上的学校类型， 
0 =私立，1 =公立）因为设计方面的担心，包括在描述中但 
没有包括在模型中。 

ECLS - K 抽样方案设计要求对亚裔和太平洋岛国背景的 
儿童过度抽样，目前它包括三轮数据，分别在入园时、幼儿园 
年级结束时、一年级结束时各收集一次。三年级的数据在 
2004年春季发布。它还对30%的进人一年级时的儿童子样 
本收集数据。本书所使用的数据都包括在30%的一年级子 
样 本中; 在兴趣变量上没有缺失值的儿童，也是第一次的幼 
儿园就读者(没有留级生），并且留在与他们所就读的幼儿园 
同一所学校的一年级。考虑到本书的关注点及对亚裔/太平 
洋岛国裔的过度抽样，以及其他少数族裔的稀少，于是对这 
些例证模型生成一个种族/民族的二分变量，其分类是1 = 
少数群体，0 =白人/高加索人。具有这些特征的儿童共来 
自255所学校 (57 所私立，198所公立)共 n = 3365人，平均 
每所学校13人。第7章将会介绍嵌套设计与定序结果数据 
分析的 合并; 所有其他的分析都假定学校之间的儿童是独 
立的。 




S 减 


m 


. '_通 






― . 


_馨 
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定序 B 变釁的 logistic 回归模遒 


第1节丨 logistic 回归概述 


定序回归模型与二分结果的 logistic 模型紧密相关，所 
以作者先简要回顾一下 logistic 回归分析，以突出后面内容 
的类似性和差异性。其他 QASS 系列 ® 以及其他作者 (Cizek 
&• Fitzgerald , 1999; Hosmer &■ Lemeshow , 1989, 2000； 
Menard , 1995, 2000; Pampel , 2000) 已经深人讨论了 logis ¬ 
tic 0 © ，所以这里仅探讨那些对本书稍后章节有重要作用的 
概念。 

拟合定序回归模型的术语和估计策略是对那些在 logis ¬ 
tic 回归中所使用的术语和估计策略的直接扩展。 这些模型 
一起被定义为一般线性模型，由三个部分 构成： 

• 随机部分，这里因变量 Y 遵循指数族 （exponential 
family ) 的某一分布，例如正态分布、二项式分布或者 
逆高斯 分布； 

• 线性部分，它描述了因变量 Y 的函数 V 是如何取决于 
一系列预测变 量的； 

• 关联函数，它描述了从因变量 Y 到疒的转换 （ Fox ， 
1997)。 


①指 SAGE 出版社的 “ 社会科学的量化应用系列 ” 丛书 （Quantitative Application 
in the Social Science) „ - 译者注 
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恒等关联函数 (identity link function ) 没有改变因变量， 
从而得到连续结果变量的广义线性模型，多元线性回归是熟 
悉的案例。 logit 关联函数将结果变量转换成比数的自然对 
数形式(下面给出解释)，这就得到 logistic 回归方程。 

二分结果的 logistic 分析试图对事件的发生建模，并且 
估计自变量对这些比数的作用。一个事件的比数是简单地 
将事件发生的概率(称之为“成功”)与事件未发生的概率(称 
之为“失败”)相比得到的商。当成功的概率大于失败的概率 
时，比数就比1 大; 如果两个结果可能相等，比数则为1;如果 
成功的概率小于失败的概率，则比数比1小。 

对于上面描述的 ECLS - K 数据，假设我们感兴趣的是研 
究进人一年级时的儿童们取得阅读熟练度5级（常用字）。 
结果可以用二分描述 :一个 取得了 5级熟练度的儿童(成功） 
或者没有(失败）。取得5级的比数通过在样本数据中将取 
得5级的概率(得分为 Y = 1) 除以未能取得5级的概率(得 
分为 Y =0) : 


比数= 


P(Y= 1) 
P(Y = 0) 


P(Y= 1) 
1-P(Y= 1) 


为了检验自变量对比数的影响，例如性别或者年龄，我 
们构建了比数比，它将解释变量取不同值时的比数相比。例 
如，如果我们想比较男性(编为工= 1) 和女性(编为 x = 0) 达 
到熟练度5级的比数，则用下面的比例 计算： 


比数比= 


P(Y= 1 | x = 1) 
1-P(Y = 1 | x= 1) 
P(Y = 1 I x = 0) 
1-P(Y= 1 I x = 0) 
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定序 S 变量的 logistic 回归横型 


比数比的下界为0但是没有 上界; 也就是它们可以从0 
到无限大。比数比为1时表明解释变量对成功的比数没有 
作用，即男性成功的比数与女性成功的比数是一样的。小的 
比数比值(小于1的)表明成功分母中的 Z 值 (0 =女性)所代 
表的人群成功的比数比那些分子中 （1 =男性）的更大的 X 
值所代表的人群成功的比数更大。大于1的比数比的值反 
过来解释也成立。也就是说，男性处于熟练度5级的比数比 
女性的同一比数要大。自变量使用的编码的本质和类型在 
解释中很 重要; 在该例以至全书中，作者使用简单的虚拟或 
参照编码 (simply dummy or referent coding ) „ 其他分类自变 
量的编码方法可以改变模型中变量作用的 解释; 对 logistic 
回归模型中定性数据类别化的替代方法的讨论可以参照霍 
斯默和莱默苏 (Hosmer Lemeshow , 2000)。 

比数比是分类结果和一个自变量之间关联的测量，提供 
了“一个呈现出的结果如何随着讨论中的变量而变化的风险 
的明确指示 ” （Hosmer Lemeshow , 1989:57)。尽管事件 
的概率可以直接通过线性概率模型来建模（例如，使用对二 
分 [0, 1] 因变量的普通线性回归），但这样的方法会引起一些 
严重的解释问题。线性概率模型可能会得到[0, 1] 之外的不 
现实的概率预测，尤其是当自变量为连续变量时。此外，普 
通线性回归模型中通常的同方差性和误差正态性假设在结 
果变量为二分时也会违反，使得从这种方法中得到的结果的 
有效性受到质疑 （Cizek &- Fitzgerald , 1999; Ishii - Kuntz ， 
1994； O ' Connell , 2000)。 因而当结果为二分时，我们对比数 
建模，或者对比数的自然对数(底为 e ) 建模，称做 logit 分布。 

这种对比数的简单转换有许多理想的特点。首先，它消 
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除了内在于比数比估计中的偏态 ( Agresti ， 1996)，该比数范 
围从0到无穷，其值为1时表明比数没有变化 (no change in 
the odds ) 的虚无案例 (null case )。 logit 的范围从负无穷到正 
无穷，消除了比数比和概率的界限问题。转换模型在参数上 
是线性的，这意味着解释变量对比数的对数的作用是可加 
的。因此，模型很容易处理并允许相当直接地解释变量，还 
允许模型建构策略与普通线性回归中所使用的那些策略 
类似。 

该过程可以扩展到包括更多的自变量。如果我们令 

= 1 |七 ，七 ，…: c ,) = ; r ( x ) 代表“成功”的概率，或者兴 
趣结果(例如，儿童处于熟练度5级)，对于给定的有/>个自 
变量的集合， logistic 模型可以 写成： 

lnCY ^) = logit [ n :( x )] = ln ( 1 :(;() x ) ) 

= a + +^,X 2 + 

在该表达式中， y ' 仅是一种简便的方式，指转化过的结 
果变量的 比数; 而非直接预测 y ， 我们预测的是 y =1的比数 
(的对数）。关联函数描述了将原始的 y 与转化后的结果 
f ( y ) = ln ( T ') = ln [^( x )/( l -^( x »] 相“关联”起来的过 
程，称为 logit 关联。解； r ( 2 £) 我们则会得到 logistic 回归模型 
成功模型类似的方 程式： 

^ s _ expCa + j^X ； +^X 2 A h/3„X p ) 

^ _ l + expU + A^+A^+m+^X,) 

= _ 1 _ 

1 + exp [— (a + ^Xj +^ X 2 + … + 氏 X p )] 

SPSS 和 SAS 之类的统计软件包提供模型中变量的截距 
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定序 6 变量 的 kebtk 回归樓型 


和回归参数 ( weights ) 的极大似然 ( ML ) 估计。极大似然估计 
通过使用得到“‘最好地 ， 解释了观测数据的总体参数值” 
(Johnson &- Wichern , 1998:178) 的迭代方法推导出来。这 
些极大似然估计最大化了获得原始数据的可能性，而且因为 
logistic 模型是通过一个对结果的非线性转化得到的，该方法 
并不要求误差项的正态分布，而普通最小二乘估计要求这 
样。似然 ( likelihood ) 代表了观测结果可以从一系列自变量 
集中预测的概率。似然可以从0到1 不等; 似然对数 ( Log - 
Likelihood ， 简称 LL ) 也从负无穷到0不等。将 LL 乘以_2 
得到一个可以用来验证假设进而以比较不同模型为目的的 
值 (Hosmer Lemeshow , 2000)。 
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第2节 I 模型拟合的评估 


评估一个拟合模型是否能够良好地再造观测数据的一 
种方法是，计算拟合模型的偏差 ( deviance )。 偏差代表的是 
模型如何糟糕地再造了观测数据，它是通过将拟合模型与完 
美拟合模型一也称为饱和模型 [6] ——的似然相比较得到 
的。饱和模型的参数个数与自变量的值一 样多; 饱和模型的 
似然是1， 一2 LL (饱和模型)是0。因此，任何模型的“偏差” 
D m 就等于 一2 LL 的值 (Hosmer Lemeshow ， 2000)。我们 
期望更好的模型拟合的“劣度” ( poorness ) 降低(直到0)。两 
个嵌套模型的拟合，模型1中的变量是模型2自变量的子 
集，可以通过比较它们偏差的差异 ： G =化一^。 G 的量代 
表拟合的“优度”，对于大样本， G 服从近似的卡方分布，自由 
度等于模型1和模型2的参数个数之差。统计上显著的 G 
值意味着模型2拟合的“劣度”要小于模型1。 

当模型1是虚无模型时，这个比较提供了一个综合检验 
(omnibus test )( 假定是大样本属性且没有稀少的单元格），以 
检验拟合模型是否比虚无模型，或者是截距模型，更好地再 
造了观测数据。然而，它并没有告诉我们该模型与饱和模 
型，或者是完美模型相比表现如何。对于分类预测变量 ， SAS 
通过皮尔森 X 2 标准和偏差 X 2 来检验 D m (将拟合模型与饱和 
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定序 6 变量 的 logistic 回归模型 


模型相比）。当模型中有连续解释变量时，这些办法都不再 
合适 （ Allison ， 1999; Hosmer &• Lemeshow , 2000)。当解释 
变量为分类变量时，这些测试可以在 SAS 的模型命令中通过 
使用 “/ aggregate scale = none ” 选项来实现。 

当小样本或者数据中有稀少单元格出现(当模型中包括 
了连续自变量时，这种情况经常发生)时，应该考虑替代的评 
估模型拟合的办法;一个通常的策略是 Hosmei^Lemeshow 
( H - L ) 检验(1989, 2000)。 H - L 检验在 SAS 中通过模型命令 
中的 “/ lackfit ” 选项来 实现; 在 SPSS 中，通过在打印语句中使 
用 “ goodfit ” 将会得到该检验。 

H-L 检验在自变量 (Independent Variables , IVs ) 是连续 
变量时表现很好，因为它在数据中直接处理协变量模式的数 
目。当自变量是连续变量时，本质上数据集中的每个观测都 
有一个可能的不同协变量模式。简言之， H - L 检验形成若干 
个基于样本估计概率的称之为“风险十分位数 ” （deciles of 
risk ) 的群体。在大多数情况下，形成 g = 10个群体，但也许 
会更少，这取决于不同协变量模式间估计概率的类似性。这 
些分位数的案例可以用来生成一个 gX 2的观测到预期的频 
次表，以及该表的皮尔森 X 2 系数 （Hosmer &- Lemeshow , 
1989, 2000)。如果模型拟合良好，观测和预期频次之间应该 
保持一致，所以保留来自模型的在观测和预期频次间拟合良 
好的虚无假设。 H - L 检验在一些文献中受到效能不够的批 
评 ( Allison , 1999; Demaris , 1992)，但是依靠一个单独的检 
验表明模型充足性的做法本身是不应该鼓励的 （Hosmer & 
Lemeshow , 2000) 本章稍后将探讨包括关联测量和预测 
效率在内的更多策略。 
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通常， SPSS 对因变量中编码较高的值(如果结果编码为 
0或1的话则是 1) 的比数对数进行建模，但是 SAS 默认的是 
对较低的响应值进行建模。结果变量为二分时，结果和自变 
量对比数的作用的解释不受“成功”与“失败”如何编码的决 
定的影响，因为这两种事件是互补的。例如，如果令“成功” 
的概率或者 〆 达到熟练度5级 ） = 0. 2。那么“失败”的概率 
或者 M 未能达到熟练度5级 ）=1 — 0. 2 = 0. 8。成功的比数 
是 0.25(0. 2/0. 8)。互补事件的比数，即未能达到熟练度5 
级，将是 1/0. 25或者 4. 0(0. 8/0. 2)。因为对于因变量仅有 
两种可能结果，互补事件的比数就是该事件的倒数。当应用 
logistic 转化时，我们可以看到取事件比数的对数与该事件的 
互补的比数的对数 （ ln (4) =+ 1. 3863) 有着相反的符号 
( ln (0. 25) = —1. 3863), 但是量级相同。在 logistic 回归模 
型中，将建模的结果的编码颠倒相当于考虑回归系数的方向 
和解释后与之相同的预测概率和解释。结果变量为二分时， 
在 SAS 命令中使用“降序”选项改变了默认方法并要求计算 
机对更高值的结果类别进行建模，即如果结果编码为0或1 
时，对标签 Y = 1的类别建模(或者结果编码为1时对类别2 
建模)。然而，定序因变量类别多于2个时，应用“降序”选项 
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定序因变置的 logistic 回归横型 


将会极大地改变模型，因此需要谨慎使用。第4章将会详细 
介绍对定序结果中该选项的使用。 

对于 j = 1到 P 的自变量，多变量 logistic 模型的回归参 
数代表了 X ,每增加一个单位时 logit 发生的变化。因为以比 
数而非比数对数的形式考虑变量作用更直观（回归参数是比 
数对数的形式)，比数自身的信息通过将模型中变量的参数 
指数化得到(例如 e X p (6,))。 回归参数的指数化形式就是比 
数比，而且在计算机运行中通常都报告。比数比可以直接解 
释为自变量对成功的比数的作用，而且比数的百分比变化可 
以通过使用以下公式计算 得到： [100 X ( 比数比_1)]。 

自变量和结果变量之间的强烈关联通常可以以远大于1 
的比数比表现出来，不管方向如何。朗 ( Long , 1997) 将比数 
比称为“因素改变 ” (factor change ) 估计。对自变量一个单位 
的改变，相对应的比数比就是“成功”的比数预计将要改变的 
因素。比数比统计上的显著通常通过检验回归系数这是否 
在统计上显著不等于0,其实现的方法有 三种: Wald 检验、计 
分检验或者似然比检验。在 Wald 检验中， logistic 回归各个 
自变量作用的参数估计除以它对应的标准误，将其结果再平 
方就得到一个无作用的零假设下服从1个自由度的卡方分 
布的值。然而，在小样本中使用 Wald 统计量可能会成 问题； 
同样，在包含多种数据模式的样本里，例如当自变量是连续 
的而非分 类的; 或者分类自变量的单元格稀少时 ( Jennings ， 
1986, Menard , 1995) ，使用 Wald 统计量都会有问题 。 SPSS 
和 SAS 针对拟合模型都会报告每个变量的 Wald 卡方统 
计量。 

模型中一个自变量的贡献的计分检验取决于似然函数 
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的衍生品，而且在 SAS 和 SPSS 中都不能直接 得到； 然而， 
SPSS 的确在分段过程中使用计分检验，以决定变量何时进 
入还是离开一个发展中的模型 （Hosmer &- Lemeshow , 
2000)。似然比检验已经被看做是自变量对模型贡献的最可 
靠检验而被提倡，但在 SPSS 或者 SAS 中也没有直接提供。 
该测试可以很容易地通过一些简单但费时的编程实现，它涉 
及将嵌套模型间的偏差进行比较，也就是不含兴趣自变量的 
模型的偏差与包含它们的模型的偏差相比较。偏差的差别 
近似是1个自由度的卡方分布。因为本书的焦点是二分模 
型的发展和总体解释，作者选择了依靠 Wald 检验来评估解 
释变量的作用。然而，研究者还是需要意识到也存在该检验 
的替代方法。 
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定序因变 • 的 logistic 回归模型 


第4节 | 关联的测量 


尽管梅纳德 ( Menard ，2000) 和其他人 （ Borooah ， 2002； 
Demaris , 1992； Long , 1997) 都指出，在研究者间关于哪个消 
减误差比例最有意义的问题上尚不能达成一致，但 logistic 回 
归中确有一些与来自熟悉的普通最小二乘回归的模型记的 
类似物，它们对告知自变量群体与结果之间的关联强度可能 
有用。对于 logit 类型的模型，似然比兑值，式，似乎提供了多 
变量模型相对虚无模型 (null model ) (仅有截距)拟合度改善的 
最直观测量。•^是通过比较两个对数似然比得 到的： = 
1 — log-likelihood (模型 )/ log-likelihood (虚无 ）（ Hosmer &- 
Lemeshow , 2000； Long , 1997; McFadden , 1973; Menard , 
2000) 。它测量的是通过使用自变量集而得到的消减误差比 
例(对数似然比 ）（ 相对虚无模型）。也有其他关联强度的测 
量，但下面将只讨论几个。朗 （1997 : 102) 写道: “当拟合测量 
提供了一些信息时，它仅是部分的信息，因此必须放在激发 
该分析的理论背景、过去的研究以及考察的模型的参数估计 
的环境中进行考量。”感兴趣的读者可以参考梅纳德 ( Men ¬ 
ard ， 2000) 关于 logistic 回归的 多种记 使用的讨论，以及布 
鲁雅 ( Borooah ， 2002:19— 23) 的著作。 Huynh (2002) 提供了 
这些情况的扩展——结果变量是定序而非二分的情况。 
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第5节 I logistic 回归 


我们将使用一个简单的例子来描述以上的概念，同时也 
提供一个定序回归模型的扩展。我选取以上描述的原始 
ECLS - K 数据的子集 : n = 702 个在一年级开始时落人熟练度 
0, 1或者5级的儿童。表 3. 1提供了这个子样本根据性别划 
分的频次明细。两个结果间的子样本相当平衡。在接下来 
的数据分析中，男性被编码为 “x = 1”，女性被编为“工= 0”， 
结果变量中处于类别5级的编为 “Y = 1”，而处于0或者1级 
的编为 ‘ Y =0’’。 


表 3.1 

分性别的熟绦度 (0, 

1和5>交互列表, iV = 

702 


Y =0 

(profread 类别 
为0或者 1) 

Y = 0 (profread 类别 
为 5) 

总计 

男性 （ X = l ) 

211 

151 

362 

女性 (x = 0) 

134 

206 

340 

总计 

345 

357 

702 


男性处于更高熟练度类别的比数可以通过将处于类别5 
的概率除以不处于类别5的概率而得到： 

比数 (类别 5 I 男性 ） = = 1^171=°- 7156 
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定序 B 变置的 loebtk 回归棋型 


女性与之类似，处于熟练度类别5的比数可以由下式 
得到： 


比数(类别5 | 女性) 


206/340 = 0. 6059 

134/340 _ 1-0. 6059 


从这两个值中，我们看到对于该子样本，男孩处于类别0 
或1而非类别5的概率要更大(分子小于 0. 5) ，对于女孩，则 
相反(分子大于0.5)。因此，男孩处于类别5的比数比女孩 
处于类别5的比数要小。两个比数相比就得到比数比，它提 
供了性别和处于类别5的比数之间关联的 测量： 


比数比= 


比数(类别5 | 男性） _ 0. 7156 
比数(类别5丨女性 ）_ 1. 537 


= 0. 466 


0. 466的比数比告诉我们，对于子样本，男孩处于更高级 
别的比数是女孩处于类别5的比数的 0. 466倍，或者说不到 
一半。换一种说法,作为男孩把处于类别5的比数降低了 
53. 4%(100 X [比数比一 1] = 一 53. 4) 。相反，女孩处于类别 
5的比数是男孩的比数的 2. 146倍，或者说比男孩比数的两 
倍还多 （ I / O . 466 = 2. 146)。 

在早些时候讨论的 logistic 回归模型中，概率转化为比 
数，比数再通过取自然对数转换为 logit 。 图 3. 1给出了使用 
SPSSlogistic 回归得出的以上例子的 logistic 回归模型拟合的 
部分结果(附录1中的句法， A 1 部分)。在该模型中，处于类 
别5中 Y 被编码为1，否则为0。解释变量，“性别”编码为男 
孩“1”，女孩“0”。我们令 ln ( V ) 代表 logit ， 或者比数对数。 
预测模型是 ln ( r ) = 0. 430+ ( — 0. 765) X 性别。参数估计 
在图 3. 1的最后一部分“方程中的变量”得到。 

当儿童是女孩时(性别= 0)，截距代表的是对比数的对 
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logistic 回归 


Case Processing Summary 


Unweighted Cases 8 

N 

Percent 

Selected Cases Included in Analysis 

702 

100.0 

Missing Cases 

0 

0.0 

Total 

702 

100.0 

Unselected Cases 

0 

0. 0 

Total 

702 

100. 0 


注： a* If weight is in effect, see classification table for the total number 
of cases. 

Dependent Variable Encoding 


Original Value 

Internal Value 

0.00 

0 

1.00 

1 


Block 1 ： Method=Enter 

Iteration History 3 ' b, 


Iteration 

— 2 Log-likelihood 

Coefficients 

Constant 

gender 

Step 1 

947. 829 

-0. 755 


1 2 

947. 825 

—0. 765 


3 

947. 825 

—0. 765 



注： a* Method ： Enter. 

b. Constant is included in the model. 

a Initial — 2 Log-Likelihood : 972. 974. 

d. Estimation terminated at iteration number 3 because parameter esti¬ 
mates changed by less than 0. 001. 

Omnibus Tests of Model Coefncients 



Chi-Square 

df 

Sig. 

Step 1 Step 

25. 149 

1 

0. 000 

Block 

25. 149 

i 

0. 000 

Model 

25. 149 

1 

0. 000 
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定序因变量的 logetlc 囡归模型 


Model Summary 


Step 

-2 Log- 
likelihood 

Cox 8^ Snell 
R Square 

Nagelkerke 

R Square 

1 

947. 825 

0. 035 

0. 047 


ClassiHcation Table 3 


Observed 

Predicted 

CUMSP2 

Percentage 

Correct 

0.00 

1. 00 

Step 1 CUMSP2 

0.00 

211 

134 

61.2 


1.00 

151 

206 

57.7 

Overall Percantage 




59.4 


注： a. The cut value is 0. 500. 


Variables in the Equation 









95.0% CL 


B 

S.E. 

Wald 

df 

Sig. 

Exp(B) 

for EXPCB) 








Lower 

Upper 

Step Gender 

—0. 765 

0.154 

24. 690 

1 

0.000 

0.466 



l a Constant 

0. 430 

0.111 

15.014 

1 

0.000 

1.537 

0. 344 

0.629 


注 ： a« Variable(s) entered on step 1 : gender. 


图 3.1 SPSSLogistic 回归案例的部分输出结果 

数的预测，为0.430。将该值指数化回比数，我们有 expCO .430) 
= 1. 537,它是以上所解出的女孩处于熟练度5级的比数。 
对于男孩（性别编码为1)，我们的模型预测 变成： 0.430 + 
(-0.765 X 1) =-0. 335。将该结果指数化，得到 eq >(— 0. 335) 
= 0. 7153,这是(允许舍人误差)男孩处于熟练度5级的比 
数。最终，比数比(将舍人考虑进来）可以通过将性别的回 
归参数指数化得到， exp (— 0.765) = 0.466。该值在“方程 



第 3 章 背录 : togistic 回归 


35 


中的变量”表中最后一列给出，它正是由频次数据得出的比 
数比。它告诉我们男孩处于熟练度5级的比数是女孩比数 
的 0. 466倍。 

对于诸多研究者，解释比数比比解释 logit 要容易些，但 
是 logit 也可以被直接解释。 logistic 回归模型中性别的作用 
告诉我们，当性别的值变化一个单位时，预计 logit 将会发生 
的变化，在本例中则是从 0( 女性)到 1( 男性）。基于 Wald 标 
准， logit 模型中性别的作用统计上 显著： Wald 的= 
24. 690, p < 0 . 000。这意味着性别的估计斜率是 _0. 765且 
在统计上显著不等于0,比数比= exp (-0. 765) = 0. 466因 
而统计上显著不等于1。 

在 SPSS 例子中，虚无模型的偏差通过图 3. 1的区块 
1 (Block 1)“迭代历史”的脚注： D 。=-2^ = 972.974 而得 
到。仅包括性别变量的拟合模型的偏差是：^ =- 2 LL m = 
947.825。这两个偏差的差异是 G m = 25. 149, df = l,p = 
0 . 000。该例的模型中仅包括一个变量时，性别作用的综合检 
验也是似然比检验 (Wald X 2 检验的替代）。在“模型系数的 
综合检验”部分得到的综合检验，意味着我们在性别包括进 
模型时在 _2 LL 中可以得到一个统计显著的减少。该缩减 
表明了一个可以通过似然比於： l -( D m / D 0 )=0. 0258表示 
出来的削减偏差比例。在本例中，性别包括进模型后将虚无 
模型的偏差 CD 。=-2 L 4) 减小了 2. 58%。 

SPSS 和 SAS 在它们的 logistic 回归过程中都不报告 i ? 2 ， 
但是如上所述，它可以很容易地通过从各自统计软件已有统 
计量中计算获得。两种统计软件都报告 logit 分析的 i ? 2 统计 
量的两种 变式: 0(«和 Snelli ? 2 ( SAS 中报告为一般化的 i ? 2 ) 
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定序因变量的 loglsttc 回«樓型 


和 Nagelkerke R 2 ( SAS 中称做最大尺度的 J? 平方）。 
Nagelkerke i? 2 将 Cox 和 Snell R 2 的值重新调节以获得为1 
的界限。对于这些数据，图 3. 1中“模型概要”报告了 = 
0. 035和= 0. 047。尽管综合检验在统计上显著，但没有 
一个 J? 2 非常大，表明除性别之外的其他一些解释变量对理解 
儿童处于熟练度5级的可能性也许有用。梅纳德 (Menard， 
2000) 探讨了若干将来自普通线性回归的熟悉的 i? 2 —般化 
的尝试，但是他提倡将兒作为已有虚拟记 (pseudo i? 2 's) 中 
最有用的。 

减小拟合评估中单个值的努力，如同各个虚拟 J ? 2 们所 
做的那样，在比较竞争(嵌套)模型时也许有些价值，但是这 
仅提供了一个“模型是否充分的粗略指标” （Long, 1997： 
102)。模型充分度的考察可以通过评估观测分类结果再生 
成而得以增加，基于个体是否被预测为落人他或者她原始的 
结果 Y=0 或 Y=1 中。该预测效率的评估补充了来自于模 
型拟合检验和偏差统计缩减中的已有信息。一些拟合或者 
在观测与预测结果之间的对应的测量，受到在结果频次分布 
方面高度不均衡的数据的强烈影响，所以一项信息充分的决 
策最好是通过计算并比较若干不同测量而非仅依靠单独一 
个测量来做出的。 

为了考察一个模型将个案正确归类的能力，分类是基于 
从模型中估计的概率，而且结果是与各个类别的观测频率进 
行比较。对于任一儿童，如果基于 logistic 模型的“成功”的 
概率大于 0. 5,预测结果将会是1;否则预测结果将会是 
0(Hosmer &- Lemeshow， 2000; Long, 1997)。 SPSS 直接生 
成分类表,在区块 1 中“分类表格” (Classification Table) 标题 
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下。 SAS 中可以要求生成预测概率 ( SPSS 中也一样)进而构 
建分类 表格; 观察附录1中 A 1 和 A 2 部分的句法，介绍了如 
何生成这些预测概率。尽管存在许多不同的分类统计量 
( Allison , 1999； Gibbons , 1993; Hosmer &- Lemeshow ，2000； 
Huynh , 2002 ； Liebetrau , 1983； Long , 1997； Menard , 
1995, 2000)， 但看起来其中一些也可以用到定序因变量上。 
它们包括 r P ，即“根据分类的基准率来调整预期的误差个数” 
( Menard , 1995: 29) ,以及调整计数的 J ? 2 或者 ( adjus ¬ 
ted count R 2 or ，它与古德曼一克鲁斯凯 （ Goodman - 

Kmskal ) A 系数的非对称形式类似（即当一个变量从其他一 
系列变量中预测 时）; i ?〖 diComt 调整了个案出于偶然而被指派到 
观测因变量 ( DV ) 模型类别的可能概率的原始百分比校正测 
量 ( Liebetrau , 1983; Long , 1997)。不幸的是，文献中即使 
同样的测量也经常有若干不同的名字，读者应该密切关注各 
种文章或者文本中不同的术语。例如，梅纳德 （ Menard , 
1995, 2000) 就把反阶™,称为 A p 。 

霍斯默和莱默苏 (2000) 指出，以观测和估计概率之间对 
应的方式的模型拟合通常比基于分类的拟合评估更可靠和 
有意义。它们建议分类统计可以用来作为其他测量的附属， 
而非一个模型质量的单独指标。以上所述，考察拟合充分性 
的多个标准都在这里的例子中得以描述和报告。 

SAS 和 SPSS 都不直接提供 r p 和 A p 0?^,), 但是它们 
可以通过分类表计算出来。为了得到，首先需要得到2 X 2 
表格的误差期望个数，它 是： 

£(erro r )=2x/ (Y=0)X / (Y=1) 
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要求的关联的测量进而可以通过下式 得到： 

_ E ( errors ) X 0( errors ) 

Tp E ( errors ) 

观测误差是分类表的非对角线的元素。 r p 的另一个不 
同方程式可以在梅纳德 (2000) 中 找到; 它对定序因变量模型 
也是合 适的： 


(打— 2/») 

Tp = 1 ~^ImE2i 

这里 i 代表结果变量各个类别的指数，《为样本规模，/__ = 
正确预测的类别总和(在分类表的对角线上），/ ( =类别；的 
观测频次。对于这些数据， r p = 0. 1878,表示在调整了基准 
率 (base rate ) 后，将仅使用性别作为模型的唯一预测指标的 
分类误差缩减了大约19%。 

为了得到分类表的 R 2 ^ 或者 A p ，按照朗 ( Long ， 1997 ) 
和梅纳德 (2000) 的方法使用下面的方 程式： 

A p = 1 ! = ~' 

n — n m«k n — 

这里是指结果变量的模态类别 (modal category ) 中 
观测响应的频率(最大的行边际)。对于这些数据，当观测类 
别被作为因变量处理时， A p = 0. 1739。对于以上例子中建构 
的模型，一旦考虑因变量的边际分布的话，基于性别的预测 
熟练度类别属性(0, 1 vs 5) 则将误差减少了 17. 4%。 

SAS 在 LOGISTIC 过程中产生了若干关联的定序测量， 
可以用来补充虚拟 i ? 2 和由分类表格得到的预测效率统计 
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量，例如 Somer’s D ， 一个等级相关统计量 ( Cliff ， 1996; Lie - 
betrau , 1983)。大部分的等级定序统计量是基于调和 （ con ¬ 
cordant ) 与非调和 （ discordant ) 配对 （ pairs ) 的概念。 “配对” 
是指将各个个案(个体)与每个数据集中的其他个案(不包括 
它本身)进行配对。对于样本量为《的样本，有 — 1)/2 个 
可能的个体间配对。我们关心的是那些没有相同测量取值 
的 配对; 忽略那些在观测变量的取值上相同的配对。如果两 
个个案有不同的响应，观测值是1的个案的配对观测概率 
(基于模型而被归类到“成功”)大于观测值是0的个案的配 
对观测概率，则称为调和 配对; 否则称为非调和配对。一个 
既不能归人调和亦不能归人非调和的配对(不同的响应)将 
被混淆(这在预测概率非常接近时可能 发生; SAS 将预测概 
率按照 0.002 的间距长度进行类别化 ）（ SAS ， 1997)。变量 
作用就是计算精确预测了不同结果的各个个体配对的方向 
的次数。 Somer ’ sD 也许是最广泛使用的现有的等级序列相 
关统计量: Somer’s D = (nc — nd )/ t ; 这里 nc =调和配对的 
个数 ； nd =非调和配对的个数。使用 SAS 时，该例的 
Somer ’ D 是 0. 189,表示观测结果和预测概率间对应关系的 
强度。[ 8 ] 
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第6节 I 比较统计软件间的结果 






为了方便不同统计软件间 logistic 分析的应用和解释， 
同时也为了将我们的讨论导向定序结果的处理，我们对先前 
的模型也通过 SAS 的 LOGISTIC (升序和降序两种方法)和 
SPSS PLUM (定序结果)来拟合。结果的概要在表 3. 2中给 
出（这些模型的句法在附录1中，从 Al — A 4)。 所有的模型 
都使用 logit 关联函数。 


表 3. 2将二分结果的 SPSS、SAS 和 SPSS PLUM 的结果进行 比较: 
分性别的阅读熟练程度 (0, 1 vs5)*, N = 702 



SPSS Logistic and 
SAS( descending) 

SAS( ascending) 

SPSS PLUM 

Probability estimated 

尸 (:v=l) 

P(y = 0) 

P(y<0) 

Intercept 

0.430 

-0. 430 

0.335 

gender=l(male) 
gender=0( female) 

-0. 765“ 

0. 765“ 

0 

0. 765** 

Model fit 

—21X( intercept only) 

972. 94 

972.974 

972. 974 b 

—2LLC model) 

947. 825 

947. 825 

947. 825 

乂?(户） . 

25.149«0. 0001) 

25. 149«0.0001) 

25.149«0. 0001) 

Model predictions (户） 

Male 

0.417 

0.583 

0.583 

Female 

0. 606 

0. 394 

0. 394 


注:& 如果响应熟练度是 0 或者 1 的话， y = 0; 如果响应度是 5 的话， 
则 y = 1。 

b. 在 SPSS PLUM 的打印命令中使用 “kernel”， 可以求得似然的饱和值 

(full value) 0 

* * />< 0. 01。 
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观察表 3. 2 中第 1 列的结果，注意到 SPSS 的 LOGISTIC 
REGRESSION 和 SAS 的 LOGISTIC 过程 （ 降序 ） 都是基于 
估计 P ( Y = 1) 并拟合相同的模型，也即儿童的响应是熟 
练度 5 级的概率。这两个相同模型的概率预测可以通过 
先使用提供的估计来计算男孩和女孩的 logit ， 再将这些 
logits 指数化以决定各个群体的比数,然后将这些比数转化 
成界定为“成功”的响应的概率/^ =[比数(成功 )/(1 +比数 
(成功)]。 

第二个模型的结果在表 3. 2 的第三列呈现，使用 SAS 的 
升序选项，简单地对儿童熟练度响应类别为0或者1的概率 
进行建模，而非对儿童响应类别为 5 的概率进行建模。注 
意，截距和性别作用的符号与那些第2列中的相反，但仍然 
是同样的量级。第 2 列和第 3 列中男孩的概率估计的总和 
等于 1 ， 女孩的也类似。降序选项的 SAS (第 2 列)是对默认 
方法(升序，第 3 列）中的事件的互补 （complementary of the 
event) 进行建模。因此，用升序方法推导出来的概率是那些 
在使用 SAS 降序选项得到的概率的互补 （complementary 
probabilities ) 。 

使用 SPSS PLUM 的模型参数估计看起来与先前使用的 
方法很不一样，但是实际上概率估计与第 3 列中的那些（而 
且正因为如此，互补的法则可以用来得到第2列中的概率估 
计)是一样的。 SPSS PLUM 是一款专门设计用来分析定序 
因变量变量的程序，参数估计的结果将不会与那些在 SPSS 
logistic 回归中得到的完全对应，尤其是在 SPSS PLUM 中估 
计的概率处于或者低于某特定结果值的响应的概率,即更小 
的响应代 码时; 比较而言， SPSS LOGISTIC 是对较高的结果 
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值类别的概率进行建模。此外， SAS 将二分的和定序的响应 
都通过它的 LOGISTIC 过程来处理 ， SPSS PLUM 过程使用 
了一种与一般线性模型稍微不同的 公式： ln ( Y ；) = d ,— 

。在该式中，下标 j 表示响应类别是指单个因变量， 
性别。性别作用的估计是从截距中减去的。另一个 PLUM 
的结果与那些在 SPSS 或者 SAS 中的 logistic 回归程序的重 
要区别是, PLUM 在内部设置分类预测变量的编码。在第四 
列中，性别作用的估计对应于性别= 0,也即女性。所用的编 
码系统清晰地在输出结果中呈现 (PLUM 和 SAS 的定序模型 
的输出结果的例子将在下一章呈现)。为了得到女孩处于(最 
多)熟练度0或1级的估计概率 P ( Y <0), 在本例中也等于 
P ( Y = 0 ), 因为没有小于0的响应，我们使用该估计来得到女 
孩的预测 logit (0. 335 - 0. 765 =- 0. 43) ,指数化这个结果 
以得到女孩处于(或者低于 ） Y = 0的比数 ( exp (- 0. 43) = 
0. 65), 然后再解岀估计概率 （0. 65/(1 + 0.65) = 0. 394) 。使 
用相同的过程以得到男孩处于(或者低于)类别0或1的估 
计概率，或者 P < T =0)。 

除了 和之外 ， SPSS PLUM 还提供了 ，称为麦 
克法登的虚拟 i ? 2 ( Long ， 1997； Menard , 2000)。为了得 
到 _2 LL 偏差统计量的必需值，必须在 SPSS PLUM 的 
“/ print ” 命令中写明 “ kernel ” 选项，可以在附录1中的 A 4 部 
分看到。 

以上是关于 SAS 和 SPSS 如何处理二分结果的讨论及 
简单比较说明。尽管模型参数估计在表面上也许不同，但从 
模型估计中得出的结果预测概率，以及模型预测统计量来 
看，它们在软件和方法间是一致的。这些简单的例子也说 
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明，分析者需要意识到，一旦选择某种统计软件，则预测的结 
果和分类自变量是如何整合进模型中的这一点很重要。方 
法和软件间的区别随着超过二分案例的定序因变量类别的 
增加而变得更加重要。 
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定序因变置的 logistic 回归型 


第1节 I 累积比数模型概述 


对于仅有两个类别的结果变量， logistic 回归被用来对其 
中之一的结果进行建模，通常称之为“成功”，作为一系列自 
变量的函数。兴趣响应的估计概率， P (成功)及其互补， 1 — 
P (失败），可以通过第三章中所示的例子用 logit 预测模型来 
得到。当一个结果变量的可能响应由多于两个的类别组成 
并且本质上是定序的时候，“成功”的概念可以由许多不同的 
方式构成。定序因变量的回归模型正是为这种情形设计，而 
且是二分的 logistic 回归模型的扩展。拟合定序回归模型的 
复杂性部分来自于如何才算“成功”以及对“成功”的后续概 
率构造模型有多种不同的可 能性。 

例如，给定 K 水平的定序变量，例如在 ECLS - K 研究(表 
2.1) 中的早期阅读熟练度 K = 6的，我们可以得到若干不同 
的“成功”代表，这取决于如何看待数据。总体而言， K 个水平 
的定序数据可以被1个“成功”切割点分割 ( Fox ， 1997; 
McCullagh &- Nelder , 1983)。当然，成功是相 对项; 通常，它指 
定了我们关注的事件。例如，“成功”也许被定义为有儿童在 
熟练度上得分为“0”类，即那些不能识别大写或者小写字母的 
儿童。在数据的这种分割下，我们的兴趣在于找出那些与处 
于该最低类别的可能性增加相关联的因素，而非那些高于0 
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的类别，从1级到5级。也许有某些儿童的、家庭的或者学校 
的有害特点与处于最低类别的可能性增加相关联。对于这些 
解释变量，我们计算的是处于(或者低于)类别0的比数。 

接下来我们将“成功”设想为由处于或者低于类别1的事 
件 组成; 我们对这种数据划分的兴趣在于找出相对于超过最 
低阶段的可能性(处于类别2到 5) 而处于类别0或1的更大 
可能性相关联的因素。我们可以继续以这种累积方式描述数 
据，即将“成功”最终概念化为处于或者低于类别 K ， 这当然会 
一直发生。因此，数据的最后分割或者区分不再必要。使用 
该累积过程，在有 K = 6个定序因变量类别的情形下，我们可 
以有关于数据的1或者五个不同的可能“成功”事件。 

模拟这种二分化结果的方法，以相继的二分化形式形成 
数据的累积“分割”的分析，被称为比例或者累积比数 ( C 0) 
( Agresti , 1996； Armstrong &- Sloan , 1989； Long , 1997； 
McCullagh , 1980； McCullagh &- Nelder , 1983)。 这的确是 
将数据相继地区分成二分群组的一种方法，同时仍然利用了 
响应变量的顺序。该方法的定序本质是如此具有吸引力，因 
为它具有 logistic 回归的简洁性。如果一个单独的模型可以 
用来估计在所有的累积分割间处于或者低于某给定类别的 
比数的话，则该模型将会提供比对应于以上描述的顺序分割 
的数据的 K - 1 个不同的 logistic 回归模型拟合大得多的简 
洁性。累积比例模型的目标是同时考虑一系列自变量在这 
些可能的相继累积分割的数据中的作用。然而，也有其他的 
方法定义“成功”。每种用于定序回归的不同方法都以截然 
不同的方式将数据区分，因此它们提出的研究问题也是不同 
的。数据如何分割以对应累积比例模型的概念，以及本书中 
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将要讨论的用于拟合定序回归模型的其他两种方法——连 
续比例 ( CR ) 模型和相邻类别 ( AC ) 模型，都在表 4. 1的提示 
列中呈现。后两种方法将在后面的章节里详细讨论。本章 
集中讨论 CO 模型。 

当应用定序回归模型时，可以从数据中得出一个简化的 
假设，即比例的或者平行的比数假设。该假设是指在表 4. 1 
中呈现的各个模型的类别 ( CO , CR ， AC ) 的解释变量对比数 
有相同的作用，而不管数据的不同相继分割是怎样的。例 
如，如果用一系列对应于以上描述的 C 0 模型的单个的二分 
logistic 回归来拟合数据的话，平行性的假设意味着我们会观 
察到一个变量在所有的回归中具有共同的比数比（或者作 
用）； 即假设一个自变量对比数的作用在对应的分割间是不 
变的 （ Agresti ， 1989； Brant , 1990； Menard , 1995; Peterson 
&- Harrell , 1990)。 因此，一个模型就将足够描述定序因变 
量和一系列解释变量之间的关系。 

SAS 和 SPSS 都在他们的定序回归过程中提供比例比数 
假设的计分检验，但是这个比例综合测试的功效不够强大且 
不够保守 ( anticonservative ) (Peterson &■ Harrell , 1990)。测试 
几乎都得到非常小的/>值，尤其是当解释变量的个数很多 
( Brant , 1990) ，样本量很大 ( Allison , 1999; Clogg &- Shihadeh , 
1994) 或者在连续的解释变量被纳入模型 ( Allison , 1999) 时。 
因此，仅基于计分检验而得出拒绝比数比例性假设的结论要 
很谨慎，拒绝考察中的特定定序模型的平行性（比例比数)假 
设，意味着至少有一个解释变量也许在结果的各水平上有不 
同的作用，也就是说，存在着在一个或者更多个自变量与从数 
据中推导出的分割之间的交互项 (Armstrong & Sloan , 1989； 
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Peterson &. Harrell , 1990)。问题的关键是能够找出哪个 
(或哪些)变量对于拒绝总体检验起作用。 

一个考察自变量作用在累积 logit 中是否相对稳定的合 
理策略，是比较所考察的对应于定序模型(表 4. 1所示）的各 
个单独 logistic 回归模型间的变量作用。尽管简化比例性假 
设在对数据拟合总体模型时也许有用，但推荐的做法是，研 
究者应当检验隐含的二分模型以辅助关于定序方法适合性 
的决定 ( Brant , 1990； Clogg Shihadeh , 1994； Long , 1997； 
O ’ Connell ，2000)。 在对应的单独 logistic 模型拟合中，非正 
式的斜率比较提供了关于数据平行性可信度方面的支持信 
息。本章稍后将介绍一种对一些解释变量放宽比例比数假 
设的方法，如偏比例比数 (Partial Proportional Odds , PPO ) 模 
型 （Ananth Kleinbaum , 1997 ； Koch , Amara &- Singer ， 
1995； Peterson Harrell ，1990)。 

表 4.1 与三种不同定序模型方法相关联的类别比较， 

基于一个六水平的定序结果 (J = 0, 1，2, 3, 4, 


累积比数(升序) 
P(Y^j) 


累积比数(降序) 
p(y> ；) 


连续比例 
P(Y>j\Y^j) 


相邻类别 

pcy =； + i |7=> 
或 


类别0相对所有之上的 
类别 

类别0和1的组合相对 
所有之上的类别 


类别5相对所有之 
下的类别 

类别5, 4相对所有 
之下的类别 


类别1到5相 
对类别0 


类别2到5相 
对类别1 


类别1相对类别0 


类别2相对类别1 


类别0, 1和2的组合类别5, 4和3相对类别3到5相类别3相对类别2 
相对所有之上的类别所有之下的类别 对类别2 


类别0,1，2和3的组类别5, 4, 3和2相类别4和5相类别4相对类别3 
合相对所有之上的类别对所有之下的类别对类别3 


类别0,1，2, 3和4的类别5, 4, 3, 2和1类别5相对类类别5相对类别4 
组合相对类别5 相对类别0 别4 
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第2节 I 单个解释变量的 
累积比数模型 


为了描述累积比数模型的使用，作者从拟合仅有一个类 
别解释变量一性别的简单模型开始。表 4. 2给出了男孩 
和女孩分别在五个早期阅读熟练度类别中的频次。数据在 
熟练度类别的分布上不平衡，大部分的儿童，无论男女，都落 
在熟练度3级内。数据的该特性在决定采用定序 logit 模型 
( CO , CR , AC 或者其他)时是一个重要的考虑 因素; 然而，为 
了教学的目的，我们在这里先忽略该数据的特性，然后在描 
述完全不同的定序模型后再检验它的影响。 

累积比数模型用来预测处于或者低于某特定类别的比 
数。因为有 K 个可能的定序结果，模型实际上做出 K _1 个 
预测，每个对应于相继类别间的累积概率。如果我们令 
n ( Y < j | Xj , x 2 , ••• , j ： p ) = tz , ( x ) . 代表某响应落入小于或 
者等于 j 类的类别里0 = 1, 2, 于是我们得到 

每一个个案的累积概率集合。最终类别的累积概率一直是1 
(注意，在 ECLS - K 数据里，作者使用0指代第一类，尺=第 
6类指熟练度5级）。通过一般 logistic 回归模型的扩展，累 
积概率的 logit 预测，被称为累积 logits ， 如下 所示： 
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ln ( y ；) = )= a , + +^ X 2 + -% X p ) 

可以将与处于或者低于某特定类别 _；' 相关联的累积 logits 指 
数化，以得到累积比数的估计并用来计算与处于或者低于类 
别_?+相关联的累积概率。 

表 4. 2也以男孩女孩处于或者低于类别的实际概率 
(户)，累积概率(功)和累积比数 ( C 0) 的形式反映了 ECLS-K 
数据的交互表。粗体行包括了这些数据的关联比数比(男孩 
对女孩)。最后两行提供了不分性别的累积比例 P ( Y , <类 
别 j ) 。从表格中我们发现，随着因变量取值的增加，处于或者 
低于任意特定类别的比数也在增加。这在直观上说得过去， 
因为在样本中很少有儿童处于最高的类 别里; 儿童更有可能 
处于或者低于某给定类别而非超过该类别。总体来说，样本 


表 4. 2性别与无核熟练度类别的交互分类观察数据 :頻次 (/) ,比例 ( P ) ， 
累积比例 Up )， 累积比数 a («>) 以及比数比(0«) 


类别 

0 

1 

2 

3 

4 

5 

总计 ( f ) 

男性 

/ 

48 

163 

320 

735 

256 

151 

1673 

P 

0. 0278 

0.0974 

0.1913 

0. 4393 

0. 1530 

0. 0903 

1.000 

cp 

0. 0278 

0.1261 

0.3174 

0. 7567 

0. 9097 

1. 000 

— 

CO 

0. 0295 

0.1443 

0. 4650 

3. 110 

10. 074 

— 

— 

女性 

/ 

19 

115 

274 

747 

331 

206 

1692 

P 

0. 0112 

0. 068 

0. 1619 

0. 4415 

0. 1956 

0. 1217 

1.000 

cp 

0. 0112 

0. 0792 

0. 2411 

0.6826 

0.8782 

0. 9999 

— 

CO 

0. 0113 

0.086 

0. 3177 

2. 1506 

7.21 

— 

— 

OR 

2. 6106 

1_ 6779 

1.4636 

1.446 

1. 3972 

— 

— 

总计 (/) 

67 

278 

594 

1482 

587 

357 

3365 

total 

0. 0199 

0.1025 

0. 279 

0. 7195 

0.8939 

1.000 

— 


注累积比数=比数 ( Y , < 类别 j )。 
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中男孩的比数大于女孩的比数，因为从比例上来讲，样本中 
的男孩比女孩一年级测试开始达到更高类别的比例更小。 
比数比让这种模式更清晰。男孩处于或者低于某特定类别 
的比数大约在 1. 72( 平均值)。在一年级开始时的熟练度定 
序测量中，趋势是女孩更有可能超过男孩。 

与第3章中的例子类似，作者准备呈现使用三种不同的 
方法拟合一个变量的简单 C 0 模型的结果: SAS 的 logistic a 
程、 SAS “降序”的 logistic 过程以及 SPSS 的 PLUM (所有模 
型的句法在附录 B 部分提供)。表 4.1 给岀了简单的一个变 
量累积比数模型的 SAS 输出结果（以默认的“升序”选项）。 
累积比数模型的合适关联函数是 logit 关联。 C 0 模型的另 
外两种方法的句法在 B 2 和 B 3 部分。尽管当需要 C 0 模型 
时，从预测的角度讲这些方法在本质上是相同的，但在 CR 和 
AC 定序回归模型中不一定如此。在以最简单的 C 0 模型案 
例开始时，明白程序和方法间的类似和差别很重要。 

在使用 SAS (升序)的情况下，比数是基于较低次序类别 
的累积，即关联的预测累积概率对应于表 4. 1中第一列的模 
式。 SAS 估计的是类别乃，对于这些数据是 P ( Y < 
0) ， P ( Y < 1) ， P ( Y < 2) ， P ( Y <3), P ( Y <4), 当然最终 
的类别是 P ( Y < 5) = 1.0 (通常不包括在这些分析的输出结 
果上)。一个可靠的 C 0 模型能够重新得到从表 4. 2的数据 
中得岀的累积比数和累积概率。 

在这些模型里，性别对于女孩来说编为0而男孩编为1。 
观察图 4. 1中提供的输出结果，我们可以看到比例比假设对 
这些数据是成立的（比例比数假设的计分检验），< = 
5. 3956, ^ = 0. 2491。我们可以总 结说: 性别的作用在数据的 
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五个分割间统计上差异不 显著; 这表明如果用五个单独的二 
分 logistic 模型来拟合表 4. 1中对应的模式，则各个模型中性 
别的斜率(以及比数比)都将类似。因此，性别的比数比可以 
仅通过一个模型来同时估计。因为性别是这里唯一包含的 
模型，结果也告诉我们表 4. 2中的五个比数比在统计上差别 
不显著，一个共同的比数比可以用来概括性别对熟练度的 
影响。 

虚拟 i ? 2 统计量在输出结果的“模型拟合统计量 ” (model 
fit statistics ) 中可以得到（图 4.1) ，在 “logistic 过程 ” (the LO ¬ 
GISTIC procedure ) 线以下 ， Cox and Snell 冗 = 0. 0110, 并且 
NagelkerkeCSAS 中称做最大尺度的 i ? 平方）圮= 0. 0116。 
似然比= 0. 0037可以通过使用仅含截距的模型的 一2 LL 
统计量加上概要表里“模型拟合统计量”中的模型协变量信 
息得到。从总体上看，这些记统计量表明因变量和解释变 
量之间的关系很 微弱。 然而，模型整体拟合的检验(“检验全 
局虚无假设”)在统计上全部显著，而它是用来评估拟合模型 
相对虚无(截距模型)模型是否改善了预测，所以我们拒绝虚 
无模型而支持含有性别作为预测变量的模型。尽管虚拟 R 2 
很低，似然比检验表明从模型中预测得到的男孩和女孩的累 
积比例模式(见表 4. 3,稍后解释它们）比我们所期望的不考 
虑性别的(表 4. 2最后一行）累积比例提供了比实际中男孩 
女孩的累积比例(见表 4. 2) 更好的配对。简单 CO 模型清楚 
表明了这些比例在男孩女孩间是如何不同的。 

输出结果的下一部分(图 4. 1) 包括‘‘极大似然估计的分 
析”，一个含五个截距的表格,被称为阈值参数 (threshold pa ¬ 
rameters ) : K — 1个切割点各一个。把这些阈值着成儿童有 
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The LOGISTIC Procedure 


Model Information 


Data Set 

Response Variable 
Number of Response Levels 
Number of Observations 
Model 

Optimization Technique 


WORK GONOMISS 
PROFREAD 
6 

3365 

cumulative logit 
Fisher’s scoring 


Response Profile 


Ordered 


Total 

Value 

PROFREAD 

Frequency 

1 

0.00 

67 

2 

1.00 

278 

3 

2.00 

594 

4 

3.00 

1482 

5 

4. 00 

587 

6 

5.00 

357 


Probabilities modeled are cumulated 
over the lower Ordered Values. 


Model Convergence Status 
Convergence criterion(GCONV— 1E — 8) satisfied. 
Score Test for the Proportional Odds Assumption 


Chi-Square DF Pr 〉 ChiSq 


5. 3956 


Criterion 

AIC 

SC 

—2 Log L 


4 

Model Fit Statistics 
Intercept 
OnlY 
10063. 980 
10094. 586 
10053. 980 


0. 2491 

Intercept 
and Covariates 
10028. 591 
10065. 319 
10016.591 
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The LOGISTIC Procedure 


R-Square 0.0110 Max-rescaled R-Square 0.0116 
Testing Global Null Hypothesis ： BETA=0 


Test 

Likelihood Ratio 

Score 

Wald 


Chi-Square 
37. 3884 
37. 2553 
37. 2060 


Pr 〉 ChiSq 
<0. 0001 
<0. 0001 
<0. 0001 


Analysis of Maximum Likelihood Estimates 





Standard 

Wald 

Pr> 

Parameter 

DF 

Estimate 

Error 

Chi-square 

ChiSq 

Intercept 0. 00 

1 

-4. 1049 

0.1284 

1022. 263 

<0. 0001 

Intercept 1. 00 

1 

-2. 3739 

0. 0667 

1266. 52 

<0. 0001 

Intercept 2. 00 

1 

-1. 1474 

0.051 

505. 4293 

<0. 0001 

Intercept 3. 00 

1 

0.759 

0. 0485 

245. 3247 

<0. 0001 

Intercept 4. 00 

1 

1.9545 

0. 0627 

971. 9783 

<0. 0001 

GENDER 

1 

0. 3859 

0. 0633 

37. 206 

<0. 0001 


Odds Ratio Estimates 


Point 95% Wald 


Effect 

GENDER 


Estimate 

1.471 


Confidence 
1. 299 


Association of Predicted Probabilities 
and Observed Responses 


Percent Concordant 

29 

Somers's D 

0.079 

Percent Discordant 

21. 1 

Gamma 

0. 159 

Percent Tied 

49.9 

Tau-a 

0. 058 

Pairs 

4110137 

c 

0. 540 


图 4.1 SAS 累积比数棋型供子 :性用 
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定序 B 变置的 logistic 回归模型 


表 4. 3预测累积 logit , 男孩女孩处于或者低于类别 ） 的估计比数， 
估计累积概率 ( cp >, 以及从 CO 模型中得到的估计比数比 ( SAS 的升序选项) 


比 较 

(y<o) 

( Y <1) 

(y<2) 

( Y <3) 

(y<4> 

男孩 

累积 logit 

-3. 719 

-1.988 

一 0. 7615 

1.1449 

2. 3404 

累积比数 

0. 02427 

0. 13696 

0. 467 

3.1421 

10.385 

cpb 

0. 0237 

0.1205 

0. 3183 

0. 7586 

0. 9122 

女孩 

累积 logit 

-4. 1049 

-2. 3739 

-1. 1474 

0. 759 

1. 9545 

累积比数 

0.0165 

0. 0931 

0.3175 

2. 1363 

7.0604 

C P S 

0. 0162 

0. 0852 

0. 241 

0. 6811 

0.876 

OR 

1. 4711 

1.4711 

1.4709 

1.4708 

1. 4709 


可能会被预测到更高类别的标记点（以 logit 的形式)很有用， 
但是它们通常不是单独解释的，类似于在定序多元回归模型 
中的截距函数。然而，通过性别的虚拟编码(性别= 0表示 
女孩），这些阈值估计代表了对应于类别 j 的女孩的预 
测 logit 。 性别对 logit 的作用是 0. 3859,关联的比数比是 
1. 471[ exp (0. 3859) = 1. 471]。模型告诉我们，男孩处于或者 
低于类别的比数大约是女孩比数的 1. 471倍，不考虑我们 
考察的是哪种累积分割。该结果可以与我们在表 4. 2中观 
察数据的模式进行比较，表 4. 2中的类别间的平均比数是 
1.72。根据模型，男孩相对女孩更不可能超过某一特定类 
别,这与实际数据一致。该模型假设性别的作用在不同的单 
独累积分割中是一致的。因为我们在性别作为预测变量纳 
人模型中时没有拒绝比例比数假设， C 0 模型表明累积分割 
(表 4. 2) 的单独比数比与从 C 0 模型中得到的 1.471 的比数 
比在统计上没有差别。 

再来看模型参数估计的直接解释，截距和性别的作用可 
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以用来估计累积比数，即男孩和女孩处于或者低于某一特定 
类别的比数。它们还可以用来估计各个分割的比数比，尽管 
我们已经从我们的分析中知道它是 1. 471。对男孩和女孩的 
累积比数估计可以与那些从原始数据中得到的(表 4. 2) 进行 
对比。性别= 0,即女孩对应于各个累积类别截距的预测， 
被指数化后就提供了女孩处于或者低于类别7的响应的比 
数。男孩的预测通过将性别=1的值代入累积比数模型的 
各个单独方程等式并指数化后得到比数： ln ( Y ；) = + 

0.3859 ( 性别）。例如，对于代表的 logit , 对女孩的 
logit 预测是 一4. 1049;对男孩，预测概率是一 3. 719。表 4. 3 
提供了基于模型的这些估计累积 logits , 还有男孩和女孩的 
估计累积比数 （ co )[ exp (累积 logit )]。 通过这些累积比数， 
男孩和女孩的比数比可以通过各个类别轻易得到，这些在表 
4. 3的最后一彳了呈现(例如， co Ma / co Aa ) 。将误差舍人，这些 
比数比都近似等于1.47。估计累积比数通过孕=«/(1 + 
co ) 转换成估计累积概率(哕)，得到 P ( Y < 类别）)。结果在 
表 4. 3中展现，可以与表 4. 2中观察到的累积概率进行比 
较。总体来看，估计值似乎很好地匹配了 数据; 该模型的似 
然比检验统计上显著。 

比数比固定,并因此在所有累积类别间保持一致，这意 
味着总体上男孩处于或者低于任何类别 j 的比数是女孩处 
于或者低于类别的比数的 1.47 倍。对于本例，男孩比女孩 
更有可能处于或者低于任一给定 类别; 女孩更有可能比男孩 
处于更高的类别。性别（男= 1) 对累积概率有着正面的作 
用 （6 = 0. 3859) ，对应于男孩相对女孩处于或者低于类别 
的更大比数。这个最后解释与以这种方法进行建模的转换 



58 


定序 B 变置的 lopstk 回归植型 


过的结果变量一致(处于或者低于类别 j ' 的响应），因而对 
logit 的方向和解释变量作用的说明就依赖于这些结果是如 
何被呈现的。 

估计和实际累积概率的差别归因于 C 0 模型将一个非常 
特殊的结构置于数据之上的事实。这个结构通过比数比的 
行为得以证实，因此它也影响了从模型中估计得到的累积比 
例。累积概率的估计是在比例比数假设下推导出来的。尽 
管我们稍早看到该假设在性别间成立，但认识到模型估计和 
预测概率是由该假设推导出的还是很重要。当那些该假设 
不成立或者看起来在经验上或者理论上不可信时，这些估计 
概率可能会明显不精确。不幸的是，当模型变得更复杂时， 
对比例比数假设将很难充满信心。作者将在本章末再讨论 
这个话题。 

该分析的 Somers ’ D 是 0. 079( 见图 4. 1的最后一部分）， 
这是相当低的。由于仅有一个预测变量，我们在儿童配对中 
的预测概率的定序方向上得到的线索相当 微弱。 为了构建 
预测效率测量的分类表， r p 和 A p ， 我们可以使用各个儿童的 
累积预测概率的集合来评估个体类别归属的概率在何处达 
到最大。通过在输出子命令中使用 “ predprobs = cummula - 
tive ” 选项， SAS 生成一个包含 了第； 个儿童在各个层次上的 
累积概率的文件 ，印 0, = P (处于或者低于0 级)，机= 
P (处于或者低于1级），等等。因此，数据集中每个儿童都有 
K 个新观测，所有儿童的孕 5,. = P (处于或者低于5级) = 1。 
类别概率可以通过使用关系式 P ( Y = 类别 j ) = P ( Y < 类别 
j ) — 类别 (j — 1)]，即 P i ( Y =0) = cfiO i； P i ( Y = 1) 
= c /> l , — P,(Y = 2) = 印 2; — 孕 1,. 得到，等等。某个儿 
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童的最大类别概率对应于他或者她的最好的熟练度预测水 
平。在仅有性别的升序模型里，所有的儿童都被预测到3 
级，考虑到模型的拟合很差且3级的儿童在整个样本中占了 
44%的事实就不会惊讶了。按照第3章勾画出来的方法，分 
类估计可以与观测熟练度类别一起做成表格以测量预测效 
率。对于该分析， r p 和 A p 分别是 0. 23和0。这些结果强调 
了当评估模型合理时，需要连同似然比检验来考虑关联的若 
干不同测量。 

表 4. 4提供了刚刚描述的基于以定序因变量的顺序为 
默认选项的“升序” SAS 模型的结果及其“降序”结果，与 
SPSS PLUM 结果和仅有性别作为预测变量的多元回归模型 
结果之间的比较。尽管 CO 模型本质上都是相同的，提供的 
也是性别作用相同的解释，但还是有必要指出这些模型的呈 
现结果中的一些重要异同。 

首先，与 SAS 对二分结果使用升序和降序选项的 logis ¬ 
tic 过程的结果类似，阈值 (截距) 参数的估计在符号上相反， 
量级上 ( magnitude ) 却并非 如此; 他们在输出上也显出相反的 
顺序。这也许仅是因为升序和降序选项预测的是互补事件 
的缘故。通过降序选项，模型估计的是(相反的）累积比数， 
即 P ( Y >5), P ( Y ^4), P ( Y >3), P ( Y >2), P ( Y ^ l ), 
当然， P ( Y >0) 将一直等于1。 

其次，比例比数假设的计分检验表明，比例性假设在 
分析中成立 ， Z = 5.3956, p >0.05, 尽管 SPSS 将这称 
为“平行性检验 ” （Test of Parallel Lines ) [9] 。9对于所有的 
三个模型，综合似然比检验表明定序性别模型比虚无模型拟 
合得更好 ， W = 37.388, /><0.001。 
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表 4.4 使用 SAS (升 序）， SAS (降序 hSPSSPLUM , 
以及多元线性回归对定序因变置变置的累积比数 模型: 
分性别的熟练度(_/ = 0, 1, 2, 3, 4, 5 )， N = 3365 



SAS (升序） 

SAS (降序） 

a^SSPLUM 

SPSS 

REGRESSION 

模型估计 

P ( Y < 类别 ）） 类别 ）） 

E ( Y \ X ) 

觀《 




3.108 

阈值 

a 0 = — 4. 105 

o ：5 = — 1. 955 

没 0 = — 3. 719 



a \ — —2. 374 

a 4 = — 0. 759 

$i - —1.988 



a 2 = — 1. 147 

a 3 = 1-147 

— — 0. 762 * 



a 3 = — 1. 955 

a 2 = ~ 2 . 374 

沒 3 = 1_ 145 



04 = 1. 955 

a \ = — 4. 105 

e 4 = 1 . 340 


性别二 1( 男性) 
性别= 0( 女性) 

0. 386“ 

-0. 386** 

0 

-0. 246** 

R 2 

0.004 s 

0. 004 a 

0. 004 8 

0.012 

计分检验 13 

^ = 5. 3956 

Xj = 5. 3956 

g = 5. 590 



(p = 0 . 2491) 

(p = 0 . 2491) 

(p = 0 . 232) 


Nfcdel fit 0 

X ? = 37. 388 

Xi = 37. 388 

g = 37. 388 h ， 3363 = 40.151 


( p < 0 . 001) 

( p <0. 001) 

( p < 0 . 001) 

( p < 0 . 001) 


注： a * 埒=似然比记。 

b . 针对比例比数假设。 

c . 定序模型的似然比 检验; 针对普通最小二乘法 ( OLS ) 回归的 F 检验。 

* * p < 0. 01 o 

第三，使用 SAS 升序和 SPSS PLUM 的累积比数和累积 
比例的预测完全 一样; 并且 SAS 降序得到的累积比数预测得 
到的是这些概率的互补。回忆下 SPSS PLUM , 模型预测通 
过从阈值估计中减去性别作用的影响可以得到 。 SPSS 
PLUM 也使用一套内部的编码系统来预测类别。例如，为了 
使用 PLUM 模型估计一个女孩的熟练度响应低于或者等于 
2级的累积概率，我们将 U ) 得到 ln ( 比数比 2)) = d 2 ~ 
A 性别 =-0. 762-(0. 386) =一1.148； ( b ) 指数化以得到比 
数， exp (- l . 148) =0. 3173； ( c ) 使用这些比数得到女孩的累 



第 4 章定序结果的累积(比例1比数模型 


61 


积概率， P(Y<2) = 0.3173/(1 + 0.3173) = 0. 2409,与表 
4. 3中 SAS 升序结果一致。为了阐明 SAS 降序选项的方法， 
考虑 2 Aa 的互补，即 3 AS 。使用表 4. 4中降序模型的 
参数估计，我们得到累积对数 log iK , Y>3 =a 3 + (一 0. 386) X 
性别 =+1.147 (因为女孩的性别= 0)。进而得到累积比数 
odds 女孩, y>3 = exp(l. 147) = 3. 149。估计概率是 P(Y^ 3), 
女孩= 3. 149/ (1 + 3.149) = 0. 759。这是使用 SAS 或者 
SPSS PLUM 得到的表 4. 3中 P(Y< 2) 的互补 概率： 1 — 
0. 2410 = 0. 759。 

第四，如前所述，所有的程序都被要求保存估计概率，它 
们可以很容易地（至少对那些预测变量数据很少的模型）与 
那些定序数据进行比较。 SAS 在运行 C0 模型时，将根据操 
作者的要求(升序还是降序）计算并保存累积概率。然而， 
SPSS PLUM 并不能直接得到累积概率，相反，计算并保存的 
是个体类别属性的概率。如上所述，累积概率可以直接由三 
个模型的任意一个参数估计信息得到。 

三个模型的解释是相同的，尽管阈值和截距的实际值在 
SPSS 和 SAS (升序或者降序)之间并不一致。这可以简单地 
归因于两种软件参数化所拟合模型的方式不同。 SAS 升序 
和降序方法的差异已经在符号相反的标记阈值的下标中看 
到。降序方法的累积比数是处于或者超过某特定熟练度水 
平的 比数; 升序方法和 PLUM 的累积比数是处于或者低于 
某特定熟练度水平的比数。两种 SAS 方法输出结果中阈值 
看起来是相反的顺序，但是一旦预测 logit 被转化成了累积概 
率，其结果在本质上是相同的。两种 SAS 模型中性别的作用 
符号相反，在 PLUM 中性别作用对应于性别= 0的情况，但 
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是有兴趣的读者在将模型特征和推导的累积概率也考虑在 
内的情况下，有必要用这些简单模型来验证预测概率的均等 
性。接下来是三种模型间性别处理的一个例子。 

在 SPSS PLUM 中，阈值估计是针对性别= 1( 即男性） 
时的情况，而在 SAS 中，阈值估计针对的是性别= 0( 女性） 
的情况。不考虑所用的分析，性别的作用在所有的累积分割 
间的作用是一致的，6 =± 3. 86。例如，使用 SAS (升序），男孩 
处于熟练度2级或者更低的 logit 预测是 a 2 + 6 ej8l]( ^ a<n) 

1.147 + 0. 386 =- 0. 761。这与那些根据 SPSS PLUM 分 
析得到的男孩的预测一样：艮一 6性别(男_ =— 0. 762 — 0 = 
一 0. 762。指数化以得到累积比数，再将结果转换就得到男孩 
处于或者低于熟练度2级的预测概率，则有 2) = 
0. 318 ( 表 4. 3)。在所有累积分割间基于比例比数模型的男 
孩对女孩的比数比假设是一致的，而且在 SAS 和 SPSS 
PLUM 间是等 价的： exp (0. 386) = 1. 47。这表明男孩处于或 
者低于任一类别的比数是女孩处于或者低于 类别） 的比数 
的 1.47 倍。 

使用 SAS (降序)方法，我们可以说男孩相对女孩处于 
或者超过类别的比数在所有累积分割间是一 致的： 
exp (-0. 386) =-0. 680,这表明男孩相比女孩更不大可能 
处于或者超过某一给定熟练度水平。但其解释稍有不同，这 
个结果表明男孩处于或者超过某类别_；+的比数是女孩该比 
数的 0.68 倍。女孩更有可能处于较高的熟练度类别。注 
意，两种方法(升序和降序）的比数比是互为倒 数的： 1/0.68 
= 1. 47。男孩处于或者低于类别 j 的预测概率，例如，也能够 
从 SAS (降序)模型中得到，因为 P ( Y < j ) =1 — P ( Y » + 



第 4 章定序结果的累积 ( 比例)比数棋型 


63 


1)。在该过程的另一个例子中，为了得到男孩的 P ( y <2), 
我们可以使用降序模型来得到男孩的3的累积 logit , 
a 3 +6性别(男孩们，= 1. 147 + (_ 0. 386) = 0. 761；指数化并求得 
累积概率，得到 P(Y > 3) = 0. 682；最终，1 — 0.682 = 
P ( Y <2) =0. 318,这与表 4. 3中所示的结果一致。 

我们看到，当这些模型的结果与多元回归分析的结果进 
行比较时，男孩在熟练度上低于女孩的类似模式。多元回归 
分析的因变量熟练度被编码为从0到5的值。性别变量的 
斜率(男孩= 1) 是一 0. 246。平均来看，女孩们被预测到处 
于 3. 109的熟练度水平，男孩们则处于低的熟练度水平 
(3.109-0. 246) = 2. 863。整体而言，尽管定序模型和多元 
回归模型在性别作用的方向上有些类似，但多元回归模型的 
预测结果与我们分析的数据并不一致。当我们的响应值是 
严格的定序数据时，一个平均的熟练度水平并不是我们想要 
预 测的; 多元线性回归模型不允许我们做出分类在不同的熟 
练水平间进行比较的尝试。 
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第3节 | 累积比数的全模型分析 


以上分析很好地证明了含一个变量的模型可以继续改 
善。在比例比数假设下对仅有性别的模型的预测概率与实 
际累积比例很相似，而且似然比测试结果表明，当性别纳人 
模型时，累积概率比虚无模型(不含性别的）更多地与实际数 
据一致。记统计量非常小， Somers ’ D 和预测效率测量也是。 
我们再来看一个更复杂的累积比数模型的推导，以得到六个 
熟练度水平上额外的解释变量和累积概率之间的关系。表 
4. 5提供了用表 2. 2中八个解释变量来拟合 C 0 模型的结果 
概要(公立与否是学校层次的变量在这些个体层次的模型中 
不会使用）。表 4. 5的结果是通过降序的 SAS 得 到的; 建模 
的概 率是： 类别_/)。这种方法为稍后进行 CR 和 AC 
定序模型间的比较提供了便利。全 C 0 模型的句法包括在附 
录2的 B 4 部分。 

该模型的比例比数假设不成立，可以在表 4. 5的标有 
“计分检验”一行看到。这表明一个或者更多自变量的作用 
模式很有可能在单个的二分模型间不一样，这些模型是根据 
稍早在表 4.1 中 C 0 模型所表明的模式拟合的。不幸的是， 
在连续预测变量和大样本中，计分检验几乎是一直表明应该 
拒绝比例比数假设的，因此需谨慎地解释 （ Allison , 1999； 
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表 4.5 累积比数 ( CO) 的全模型分析, SAS (降序类别 ^),5= 3365 


Variable 


6[se(fe)] 

OR 



— 6. 01(0. 54) 




~4. 73(0.53) 


«3 


-2. 62(0. 53) 


^2 


-1. 30(0. 53) 




0. 50(0. 54) 


gender 


—0. 50(0. 06)** 

0. 607 

famrisk 


—0. 26(0. 08)** 

0.771 

center 


0. 09(0.08) 

1.089 

noreadbo 


一 0. 32(0. 09) 

0.729 

minority 


-0. 15(0. 07)* 

0.862 

halfdayK 


-0.17(0. 07)* 

0.847 

wksesl 


0.71(0. 05)** 

2. 042 

plageent 


0. 06(0.01)*' 

1.063 

Ri 


0.05 


Cox 8^ Snell R 2 


0. 14 


Nagel kerke R 2 


0. 15 


Somer’s D 


0. 33 


r P 


0.21 


A p 


0.00 


Model fit 3 


= 524. 17(P<0. 0001) 


计分检验 

Xlz -- 

= 75. 47(P<0. 0001) 



注 : a* 似然比检验。 
b. 对比例比数假设。 

* /? < 0. 05 ； * * />< 0. 01 o 


Greenland , 1994； Peterson &- Harrell , 1990)。 稍后，我们将 
回到该假设的检验，至于现在，让我们解释一下模型估计和 
拟合统计量对该分析意味着什么。 

模型拟合的卡方值表明，这个全模型在预测熟练度累积 
概率时比虚无模型（没有自变量的）表现更好。我们在似然 
比和虚拟茫统计量上看到一些改善，但改善的没有我们通 
过仅有性别的模型获得的那么多。 Somer’s D 是 0. 333,这与 
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通过仅有性别的模型获得的值相比明显要更好。 

回忆一下通过六个类别以0, 1, 2, 3, 4, 5的结果测量的 
熟练度。使用降序选项，表 4. 5中的阈值估计对应于那些在 
自变量整个系列上得分为0的学生的累积 logits 预测。对 
应的是5的累积 logit ， 》 4 对应的是 Y >4 的累积 logit ， 等 
等。直到对应的是 y > 1的累积 logit , 因为所有的学生都 
有它作为第一个阈值就没有包括在降序的 logit 模型 
中(请注意，对5的升序累积 logit 模型也是如此)。 

全 C 0 模型里的自变量作用强调了变量是如何对处于或 
者超过某一特定类别的概率有所贡献的。与早些时候的仅 
有性别的模型一致，男孩更不大可能比女孩超过某一特定类 
别（比数比= 0. 607)。任何家庭风险因素的出现 ( famrisk ， 比 
数比= 0. 771) ，父母没有对他们的孩子阅读 ( noreadbo , 比数 
比= 0. 729) ，少数族裔 ( minority , 比数比= 0. 862) ，以及上 
半天幼儿园而非全天幼儿园 （ halfdayK ， 比数比= 0. 847) 在 
模型中都是负系数而且对应的比数比都显著小于1。这些特 
征与一个儿童处于更低的熟练度类别而非更高的熟练度类 
别相关联。另一方面，如幼儿园的年龄 ( plageent ， 比数比= 
1. 063) ,以及家庭社会经济地位 ( wksel ， 比数比= 2. 042) 都 
与高的熟练度类别相关联。这两个变量的斜率都是正的且 
在多变量模型中都在统计上显著不为0。人园前参加过基于 
中心的日间看护在该模型中与熟练度没有关联;斜率很小， 
而且比数比接近1。这些发现与文献中关于早期阅读能力的 
影响因素一致，就这点而言，全模型提供了关于这些选择变 
量影响该领域的熟练度的方式的合理看法。 

在预测效率方面， r P 和\相对仅有性别的模型都没能提 
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供更好的类别预测，而仅有性别的模型是将所有的儿童都预 
测到3级中。对于全模型 C 0 分析，累积概率可以用来得到 
如性别模型中描述的个体类别概率，以对应于各个儿童所得 
到的最好的熟练度预测类别的最大可能性的类别。表 4. 6 
提供了基于全 C 0 模型的分类方案结果。大部分的儿童仍然 
被归入到熟练度3级中，而且我们可以从分类表中（用第3 
章中呈现的公式)得到 r p = 0. 23和 A p = 0,表明相对于仅有 
性别的分析没有在预测上有总体改进。如果预测是模型的 
唯一目的，的确让人沮丧。然而，正如在二分 logistic 回归例 
子中提到的，这些测量未能告诉我们解释变量在熟练度类别 
间是如何影响累积概率的。霍斯默和莱默苏 (2000:157) 评 
论说，分类对群组规模非常敏感，并且“一直倾向于归人到大 
的群组中，该事实并不以模型的拟合为转移”。考察模型拟 
合中各个自变量的贡献时，应该偏好综合似然比检验 ( omni ¬ 
bus likelihood ratio test ) 以及 Wald 检验的结果。尽管如此， 
在一些研究情形下，分类的可靠性还是模型选择标准的一个 
重要 部分; 本例描述了这些统计量是如何计算的，还有他们 
被群体规模所影响的程度。 


表 4. 6全 CO 棋型的分类表 , N = 3365 



Predcat 0 Predcat 1 

Predcat 2 Predcat 3 Predcat 4 

Predcat 5 

总计 

profread 

0 

0 

1 

9 

57 

0 

0 

67 

1 

1 

2 

12 

262 

0 

1 

278 

2 

0 

3 

24 

565 

0 

2 

594 

3 

1 

3 

24 

1428 

0 

26 

1482 

4 

0 

1 

1 

577 

0 

8 

587 

5 

0 

0 

0 

332 

0 

25 

357 

总计 

2 

10 

70 

3221 

0 

62 

3365 
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第4节 I logit 中的比例 
比数和线性假设 


在定序模型中，不能直接评估 logit 的线性，并且“只有当 
logits 和协变量之间的线性关系在单独的二分 logistic 模型 
中成立时才是比例比数假设有意义的一个验证 ” (Bender 
Grouven , 1998:814)。因此，这里分别考察五个二分模型的 
(比例比数)假设，以期为定序模型提供支持。连续变量的 
logit 线性的检验通过 Box-Tidwell 方法 （Hosmer Leme - 
show , 1989； Menard , 1995) 和图形方法 (graphical methods ) 
(Bender Grouven , 1998) 实现。对于 Box-Tidwell 方法，生 
成连续解释变量的乘数项 XX ln ( X ) 并加人到主效应模型 
中。统计上显著的交互项是线性假设对该变量不一定成立 
的表示。为了从图形上考察线性关系，对连续变量生成十分 
位数，进而再与每个二分 logit 的处于“成功”类别(处于或者 
超过类别 P 的儿童的比例做散点图。这里同时采取了这两 
种方法考察模型的两个连续变 量:入 园年龄 ( plageent ) 和家 
庭社会经济地位 ( wksesl )。 图片展示了一个线性趋势，但是 
Box - Tidwell 方法表明两个连续变量在所有的五个二分 logits 
中都是非线性的。考虑到做图的模式、样本量大，以及统计 
检验的敏感性，两个连续变量的 logit 线性被假设为是有道 
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理的。 

对于全 C 0 模型，比例比数或者平行比数假设的计分检 
验被拒绝。这意味着有一些自变量对于处于或者超过类别 j 
的比数的作用在随着熟练度 j 改变时并不稳定。表 4. 7( 值 
已被舍入以节省篇幅)提供了五个单独的二分 Logistic 回归 
的结果，在这里数据是二分的，且对应于表 4. 1中第二 C 0 列 
的模式展开分析。即每个 logistic 模型都考察了处于或者超 
过类别的概率。对于这些 logistic 模型（使用 SPSS ), 编码 
为1的类别归类对应于那些处于或者超过各个相继类别的 
儿童，编码0对应于那些低于各个相继类别的儿童。 

回顾表 4. 7中单独 logistic 回归的结果,相对表 4. 5中 
C 0 模型的结果，我们可以看到，所有的五个二分模型都很好 
地拟合了数据。模型的 x 2 值统计上都不显著，每个模型相 
对它的虚无模型都拟合得 更好； H - L 检验在统计上都不显 
著，从观测到预测的概率是一致的。 

现在让我们来看各个解释变量在五个模型间斜率和比 
数比的模式。性别的作用在调整了其他自变量后，看起来在 
五个单独的 logistic 回归中的模式的确不大相同了。尽管性 
别在这五个回归中的平均斜率是一 0. 604,这与多变量 C 0 模 
型中的性别斜率（一 0. 500) 多少有些接近，男孩对女孩的处 
于或者超过熟练度1级的比数比 (0. 354) 相对于其他四个比 
较 (0. 552、 0. 625、0_ 631和 0. 635) 或多或少有些低。然而， 
请注意，如果将这些二分模型的平均性别斜率的比数 
[ exp (-0. 604) = 0. 547] 与来自 C 0 模型的单个性别比数比 
(0. 607) 比较，我们看不到什么差异。平均来讲，性别的作用 
在五个 logistic 回归间类似。这对其他所有的解释变量而言 
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表 4,7 CO 分析 ( 降序 ) 的关联累积二分模型， 
CXJMSP ； 将 1^< 类别 7 与类别 / 比较 , N = 3365 


Variable 

CUMSPi 

b 

[se(b>] 

OR 

cumsp 2 

b 

[se(b>] 

OR 

cumsp 3 

b 

[se(b)] 

OR 

cumsp 4 

b 

[se(b>] 

OR 

CUMSPs 

b 

[se(b)] 

OR 

Score 

Test 8 

P value 

Constant 

3. 53 

— 0. 55 

-2.15** 

-4. 67*** 

-7. 34** 



(2.11) 

(0.99) 

(0. 68) 

(0. 68) 

(0.99) 


gender 

— 1.04 

一 0. 60 

—0.47 

-0.46 

-0.46 

0. 249 


(0. 28) 

(0. 12) 

(0. 08) 

(0.08) 

(0. 12) 



0. 35 - 

0.55* 

0.63* 

0. 63* 

0.64* 


famrisk 

-0. 15 

-0.25 

-0.21 

一 0. 33 

-0. 28 

0. 450 


(0.29) 

(0.13) 

(0. 09) 

( 0 .10 ) 

(0. 15) 



0.87 

0.78 

a 81 * 

0.72* 

0. 76 


center 

—0.03 

-0.10 

0.10 

0 . 10 

0. 26 

0.219 


(0. 28) 

(0. 14) 

(0.09) 

(0. 10) 

(0.16) 



0.97 

0. 91 

1. 10 

1. 10 

1.30 


noreadbo 

一 0. 65 

—0.36 

-0.28 

—0.28 

— 0. 5 

0.095 


(0. 27) 

(0.14) 

(0. 10) 

(0.12) 

(0.21) 



0.52** 

0. 70* 

0.75* 

0. 76* 

0.61* 


minority 

-0. 23 

-0.42 

— 0. 39 

0.09 

0. 24 

0 . 000 


(0.29) 

(0.13) 

(0.09) 

(0.09) 

(0.13) 



0. 80 

0 . 66* 

0 .68* 

1. 09 

1.27* 


halfdayK 

0.07 

0 . 00 

- 0 . 11 

-0. 26 

- 0 . 11 

0. 033 


(0. 26) 

(0.12) 

(0. 08) 

(0. 08) 

(0. 12) 



0.93 

1.00 

0. 89 

0. 77* 

0. 89 


wksesl 

1.00 

0.77 

0.73 

0. 64 

0. 87 

0 . 000 


(0.17) 

(0.10) 

(0. 07) 

(0.06) 

(0. 08) 



2. 73* 

2. 17 # 

2. 07* 

1. 89* 

2. 39 # 


plageent 

0 . 02 

0. 05 

0.06 

0.06 

0.08 

0. 645 


(0. 03) 

(0.02) 

(0.01) 

(0.01) 

(0. 02) 



1.03 

1.06* 

1.06* 

1. 06* 

1. 08* 


Ri 

0.125 

0. 097 

0. 092 

0. 070 

0. 096 


邱 

0.136 

0.128 

0. 149 

0.115 

0.128 


Model 

82. 11“ 

215. 49** 

366. 40** 

280. 39 # * 

217. 92*** 


H-L b i 

7. 80 

10. 43 

13.41 

0. 74 

9. 16 



注 A 对每个自变量的计分检验，未调整 ( 模型中没有其他协变量)。 
b. Hosmer~Lemeshow 检验，均不显著。 

* p < 0. 05, **p<0.01 。 
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都成立，除了少数族裔的作用外。注意，少数族裔变量的作 
用方向在前三个分析和后两个分析之间有变化。在前三个 
分析中，比数小于1，表明少数族裔儿童比非少数族裔儿童更 
有可能处于较低的熟练度类别。然而，处于或者超过熟练度 
4级的可能性并没有差异，因为比数比在统计上没有显著不 
等于1。最后的分析将从类别0到类别4的儿童与类别5的 
儿童相比较。这里我们看到，在调整了模型中其他解释变量 
的出现后，少数族裔儿童比非少数族裔儿童更有可能处于类 
别 5 中 a = o . 238,比数比 =1. 268)。该结果在累积比数模 
型中不明显。 CO 模型提供了一个变量在数据的所有累积熟 
练度类别的二分体或者分割间的概要估计。将比数的比例 
性假设置于这些比例分割之上看起来对少数族裔变量无效。 
对在模型中的所有其他变量，斜率和比数比的方向和平均量 
级很好地对应了 CO 结果。 

不幸的是，比例比数假设的计分检验对样本规模和不同 
的协变量可能模式很敏感，这就使得它在有连续解释变量的 
B 寸候通常会变得非常大。如果没有拒绝假设，研究者应该很 
自信地说整体 CO 模型很好地代表了在单独累积分割间的比 
数比模式。然而，如果假设不成立，合适的做法是拟合单独 
的模型并将其与 CO 结果比较以检查与由 CO 模型表明的通 
常模式下的区别或者偏差。例如， Allison ， 1999； Bender 
Grouven ， 1998； Brant , 1990; Clogg &• Shihadeh , 1994； 
Long , 1997； O ' Connell , 2000。 

为了提供比例性假设真实性的更多检验，可以观察未经 
根据累积比数模型中其他协变量的出现调整的对各个解释 
变量的单独的计分检验。考虑到样本量大，所以使用 0. 01 
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的显著性水平来指导关于非比例性 ( nonproportionality ) 的决 
定。对于每一个单独的二分模型，比例比数假设的计分检验 
成立，但少数族裔和家庭社会经济地位例外。表 4. 7的最后 
一栏给出了这些未经调整的检验的值。在五个二分 logit 
模型中， wksels 的比数比接近 1. 9或者更大，表明髙家庭社 
会经济地位的儿童处于较高熟练度类别的可能性是较低社 
会经济地位的儿童的两倍。考虑到社会经济地位是连续变 
量，比数比在二分分割间的差异的量级看起来是可以忽略不 
计的，就其本身而言，一个共同的比数比对该变量也许是更 
为正当的假设。然而，如上所述，少数族裔比数比改变的模 
式将会清晰地与熟练度研究相关，该变量的作用应该更仔细 
地加以考察。尽管不在这里提供，后续包括了解释变量之间 
的交互项或者使用一个种族/民族的单独类别的变量而非一 
个总体指派的少数族裔类别的分析将能够更好地解释五个 
二分 logit 模型的作用。 
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第5节 | 累积比数模型的替代方法 


累积比数模型的最佳应用是为数据提供一个单独简洁 
预测模型。然而，如果均等斜率假设的约束不现实，那研究 
者就有责任去尽量解释数据的结构而非强行要求数据遵循 
某特定模型。在考察了单个的 logistic 回归分析并检查了线 
性和比例性后，如果多变量定序模型的比例性假设的确让人 
怀疑的话，那么就会产生几种替代方法。 

如果变量的作用极其重要，研究者可以决定使用单独的 
logistic 回归来探求并解释不同累积模型中的解释变量的多 
种模式 (Bender Grouven , 1998)。该决定依靠研究者分析 
的总体目标，而且并不是对每个情境或者研究问题都合适。 
如果需要一个简洁模型或者单独一套预测概率，这些单独的 
二分 logit 将不再合适。作为替代，研究者也许要决定完全放 
弃因变量的定序属性而去拟合数据的一个多分类模型。该 
方法可以以综合变量作用和分类的形式提供一些有意义的 
信息，但是它忽视了结果的定序属性，因而也忽略了数据的 
一个重要方面。该方法对研究者的目标也不是最优化的，但 
如果研究者相信大多数解释变量都违反了比例比数假设的 
话，也可以考虑这个办法。关于这些替代多分类方法的例子 
和讨论可以参见 Borooah (2002) , Ishii-Kuntz ( 1994 ) 以及 
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AgrestiC 1990, 1996 )。 

第三个方法将在本书的稍后章节里集中讨论，它将其他 
类型的定序回归分析，例如连续比例方法或者相邻类别方 
法，尝试并获得一个单独的拟合良好且简明的模型来辅助我 
们取得对手头数据的理解。第5章描述了 CR 或者连续比例 
模型的使用，第6章呈现了 AC 模型 （Adjacent Categories 
model )， 也即相邻类别模型。 

在转到讨论这些分析定序结果的更多策略之前，我们再 
呈现另一种方法。但仅是解释变量的一个子集而使比例性 
假设受到质疑的情景下，研究者也可以选择用偏比例比数 
(Partial Proportional Odds , PPO ) 模型拟合 （Ananth 
Kleinbaum , 1997 ； Koch et al . , 1985 ； Peterson &- Harrell , 
1990)。 在本质上， PPO 模型允许自变量和不同 logit 比较之 
间的交互项，这也阐明了一个自变量的比数是如何在不同的 
结果水平间变化的。 SAS 当前使用 GENMOD 过程估计 
PP 0 模型。分析要求数据重构以反映个体是否处于或者超 
过某特定响应水平 （ Stokes，Davis &• Koch , 2000)。在重构 
数据集中，每个人的每个定序 logit 比较都生成一个新的二分 
响应以表示该个体是否处于或者超过某一特定响应水平。 
例如，通过一个 K 个类别的定序因变量，每个人都会在重构 
数据集中有 K 一 1行数据。推导出的新的兴趣结果变量是 
为了表明对于1个 logits 中的每一个，个体是否处于或 
者超过类别 K (包括最低类别 Y = 0,所有的儿童都是超过它 
的）。因为数据现在是相关的（人群中的重复观测），一般估 
计方程 (Generalized Estimating Equations , GEE ) 被用来拟合 
非线性模型进而拟合偏比例比数模型。在兴趣结果是分类 
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的（名义的或者定序的）时候， GEE 方法 （Liang &• Zeger , 
1986) 非常适合用于对结果变量随时间推移的重复测量。它 
基于大样本性质，这意味着样本规模必须足够大以产生可靠 
的估计。斯托克斯等人 (Stokes et al . ， 2000) 建议，数据的二 
维交互分类中的观测数量应该至少达到五个。有连续解释 
变量的话，这通常不是问题，所以应该谨慎地考虑样本规模。 
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第6节 | 偏比例比数 

jM M WSIM j — MWaMimi — ET 齡 


通过使用 ECLS - K 数据例子来描述，我们放弃少数族裔 
变量的比例比数假设并尝试以一种能够更好地反映表 4. 7 
中的模式的模型来重新拟合。也就是说，比例比数假设在模 
型中除了少数族裔变量外的所有变量间都得以保持 。 PPO 
模型以及数据集重构的句法，包括在附录2的 B 5 中，位置在 
由斯托克斯 （Stokes et al . ， 2000) 等人勾勒出的过程后面。 
图 4. 2展现了该分析的(编辑过的)输出结果。 GENMOD 对 
儿童处于或者超过类别 J 的概率建模，但是因为比数比在除 
了少数族裔外的所有各个变量的分割中都保持一致，结果仅 
包括了一个截距参数。阈值通过将各个对应分割的估计相 
加得到，这包括在图 4. 2中 “ GEE 参数估计分析”的中间部 
分。阅读这份表格时，请注意解释变量的编码方案“0”类是 
分类变量的参照组。例如，性别的斜率，6 = 0. 5002,是为女 
孩(性别= 0) 而非男孩(性别= 1) 提供的。 

截距一 6. 9805是表示如果他或者她的所有协变量分数 
等于1，或者等于 0( 如果是连续变量的话)时，儿童将会处于 
或者超过熟练度类别 5( Y > 5) 的比数 对数; 注意，分类变量 
的编码遵循一种内在建构的模式，而且第五个分割的估计是 
0.00。为了得到4的比数对数，阈值将是截距加上第四 
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个分割的作用（一 6. 9805 + 1. 2670 =-5, 7135) 。其他阈值 
估计也可以以类似的方法得到。 

GEE 分析提供了检验各个解释变量对模型的贡献的分 
数统 计量; 这些在输出结果的最后得到。计分检验的结果表 
明，少数族裔对第五个 logit 比较的作用仅是边际显著，％ = 
4. 04, p = 0 . 0445,然而它与分割变量的交互在总体上确实 
很显著， X ! = 28. 80, p < 0 . 0001。该结果表明少数族裔依赖 
于分割的作用存在着可靠的差异。对于模型中的其他解释变 
量，除了参加日间护理中心外，所有其他变量的作用都在统计 
上显著，这与全累积比例模型中的发现 一致。 GENM 0 D 也提 
供了解释变量对模型中贡献的 z 检验 ( Wald 统计量的正态分 
布版 本); 这些可以在图 4. 2中 “ GEE 参数估计分析”中找到。 
z 检验的结果与计分检验一致，除了少数族裔外。 

考虑到少数族裔和分割间的交互项，少数族裔的作用通 
过具体考察它对第五个累积比较的贡献的计分检验来解释。 
对于其他的各个分割，包括在模型中的少数族裔 X 分割的交 
互的 z 检验表明在第一个累积比较 ( Y >1) 的少数族裔儿童 
和非少数族裔儿童的比数没有显著差别，= 0.5077, p 
= 0.0677,第四个也无差别 ( Y >4), 6 ml4 = 0.0282, p = 
0. 7884。实质上，这些发现与那些表 4. 7中单独的二分模型 
一致。在那里，少数族裔对个体的累积 logits 没有统计作用， 
无论是第一个二分模型 ( P > 0 . 05) 还是第四个（/>> (X 05) 
都是这样。 

少数族裔 X 分割的交互项告诉我们，关于少数族裔在响 
应变量的阈值间的作用发生了多大的改变。伴随着对少数 
族裔比例比数假设的放宽，输出中的结果告诉我们，非少数 
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The GENMOD Procedure 


Model Information 


Data Set 
Distribution 
Link Function 
Dependent Variable 
Observations Used 


WORK PPOM 

Binomial 

Logit 

beyond 

16825 


Class Level Information 


Class 

Levels 

Values 





split 

5 

1 2 3 4 5 





GENDER 

2 

0 1 





FAMRISK 

2 

0 , 00 1. 00 





CENTER 

2 

0 . 00 1, 00 





NOREADBO 

2 

0 . 00 1. 00 





MINORITY 

2 

0 . 00 1. 00 





HALFDAYK 

2 

0 . 00 1. 00 





CHILDID 

3365 

0212014C 

0294004C 

3035008C 

3042008C 

3042023C 



0044007C 

0195025C 

0243009C 

0621012C 

0748011C 



0832023C 

3041005C 

0028009C 

0028014C 

0052003C 



0052007C 

0195020C 

0196007C 

0196016C 

0196017C 



0196018C 

0212002C 

0212012C 

0216006C 

0220005C 



0220020C 

0301002C 

0301004C 




Ordered 

Value 

1 

2 


Response Profile 

beyond 

1 

0 


Total 

Frequency 

10045 

6780 


PROC GENMOD is modeling the probability that beyond— M l w . 

Criteria For Assessing Goodness Of Fit 


Criterion 

DF 

Value 

Value/DF 

Deviance 

17E3 

12003.9325 

0. 7142 

Scaled Deviance 

17E3 

12003. 9325 

0. 7142 

Pearson Chi-Square 

17E3 

16074. 6352 

0. 9564 

Scaled Pearson X2 

17E3 

16074. 6352 

0. 9564 

Log Likelihood 


-6001.9662 
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Analysis Of GJE Parameter Estimates 



Parameter 

Intercept 

GEMOER 

GEM3ER 

FAMRISK 

FAMRISK 



HALfDAYK 

HALFDAYK 


PI ACCENT 

split 

split 

split 

split 

split 

split 

split* MINCMTY 
split *MINCKITY 
split *MESTOTY 
split ^MINCKITY 
spUt^MESfORITY 
spUt^ MINORITY 
split ^MINCKTTY 
spUt^MINCRITY 
split* MINORITY 


0 

1 

0.00 
1.00 
0.00 
1.00 
0.00 
1. 00 
0.00 
1.00 
0.00 
1.00 


2 

3 

4 

5 
1 
1 
2 
2 
3 

3 

4 

4 

5 
5 



RAGEHKT 

印 lit 

split *MINCMrY 


Standard 95% Confidence 



Estimate 

Error 

Limits 

Z 

Pr>|Z| 


—6. 9805 

0. 5753 

-8.1081 - 

-5. 8528 

-12. 13 

<0. 0001 


0. 5002 

0. 0663 

0. 3703 

0. 6301 

7.55 

<0. 0001 


0.0000 

0 . 0000 

0.0000 

0 . 0000 




0. 2596 

0. 0778 

0.1071 

0. 4120 

3. 34 

0. 0008 


0 . 0000 

0 . 0000 

0 . 0000 

0 . 0000 




-0. 0759 

0. 0770 

-0. 2268 

0. 0750 

-0.99 

0. 324 


0.0000 

0.0000 

0.0000 

0.0000 




0. 3366 

0. 0913 

0.1575 

0. 5156 

3.68 

0 ‘ 0002 


0. 0000 

0. 0000 

0.0000 

0 , 0000 




-0. 1560 

0. 1240 

一 0. 3989 

0. 0870 

一 1.26 

0. 2083 


0.0000 

0.0000 

0.0000 

0 . 0000 




0. 1451 

0 . 0666 

0. 0145 

0. 2757 

2.18 

0. 0295 


0 . 0000 

0 . 0000 

0 . 0000 

0 . 0000 




0. 7450 

0. 0514 

0. 6442 

0. 8457 

14.49 

<0. 0001 


0. 0588 

0. 0084 

0. 0423 

0. 0753 

7.00 

<0. 0001 


6 . 2595 

0. 1851 

5. 8968 

6 . 6223 

33.82 

<0. 0001 


4. 4067 

0. 1204 

4. 1707 

4. 6428 

36.59 

<0. 0001 


3. 0966 

0. 1043 

2. 8923 

3. 301 

29.7 

<0. 0001 


1. 2670 

0. 0846 

1. 1012 

1. 4328 

14. 98 

<0. 0001 

0.00 

0 . 0000 

0 . 0000 

0. 0000 

0 . 0000 



0.00 

0. 5077 

0. 2779 

-0. 0370 

1. 0523 

1. 83 

0. 0677 

1.00 

0 . 0000 

0. 0000 

0. 0000 

0.0000 



0. 00 

0 . 6021 

0. 1621 

0. 2843 

0. 9198 

3.71 

0 . 0002 

1. 00 

0 . 0000 

0 . 0000 

0 . 0000 

0 . 0000 



0.00 

0. 5230 

0. 1334 

0. 2615 

0. 7844 

3.92 

<0. 0001 

1.00 

0.0000 

0.0000 

0. 0000 

0.0000 



0.00 

0 . 0282 

0. 1050 

一 0. 1777 

0. 2340 

0.27 

0. 7884 

1.00 

0 . 0000 

0 . 0000 

0 . 0000 

0. 0000 



0. 00 

0 . 0000 

0. 0000 

0 . 0000 

0. 0000 



1.00 

0.0000 

0.0000 

0.0000 

0. 0000 




Score Statistics For Type 3 GEE Anal^is 


DF 

Chi-Square 

Pr>ChiSq 

1 

57. 02 

<0. 0001 

1 

11.1 

0. 0009 

1 

0.97 

0. 3243 

1 

13.3 

0. 0003 

1 

4. 04 

0. 0445 

1 

4. 75 

0. 0294 

1 

195. 03 

<0. 0001 

1 

49. 02 

<0. 0001 

4 

2447. 16 

<0. 0001 

4 

28.8 

<0. 0001 


图 4.2 少数族裔的偏比例比数分析 
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族裔儿童相对于少数族裔儿童的比数对数在不同的 logistic 
回归分割间预计能够改变多少。例如，在调整了模型中的其 
他协变量之后，非少数族裔儿童相对少数族裔儿童处于或者 
超过类别5级的熟练度分数的比数比是 exp (- 0. 1560) = 
0. 855；少数族裔儿童相对非少数族裔儿童处于或者超过类 
别5级的熟练度分数是 exp (+0. 1560) = 1. 169。该比数比可 
以与表 4. 7中的第五个累积 logistic 回归分割相比（比数比 
= 1.268)。该比数比在 PPO 模型中显著不等于 1(“ 类型3 
的 GEE 分析的分数统计量”表格中 p = 0 . 0445), 实际上是 
基于单独二分模型的第五个累积比较(表 4. 7中最后一个分 
割的 /><()• 05)。 

为了得到少数族裔对第四个累积 logit 的作用 ( Y ^4), 
将交互项加到主效应中，即非少数族裔儿童处于或者超过类 
别4的比数是 exp (— 0. 1560 + 0. 0282) = exp (—0.1278) = 
0. 880；对于少数族裔儿童，则为 exp (+ 0. 1278) = 1. 136。 
少数族裔儿童有 1. 36倍的可能性处于或者超过类别4,尽 
管该作用在统计上没有明显不等于 Up = 0 . 7884)。该作用 
与表 4. 7中第四个累积 logit 中的比数比一致，它在统计上 
也不显著(比数比= 1. 092,不显著)。对于第一个 logit ( Y > 
1)，非少数族裔儿童的作用是 exp (- 0. 1560 + 0. 5077) = 
exp (0. 3571) = 1. 42 ;对于少数族裔儿童，则是 exp (-0. 3517) 
= 0. 7035。根据 PPO 模型，该作用不显著 (p = 0 . 0677)，与 
表 4. 7中第一个分割的少数族裔的作用一致。总之，少数族 
裔儿童比他们的非少数族裔同龄人更不大可能超过熟练度2 
级和3级，但是一旦他们获得了至少4级的熟练度时，他们 
比他们的非少数族裔同龄人更有可能取得熟练度5级的 
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水平。 

为了检验那些保留了比例比数假设的解释变量的作用， 
可以直接解释估计的斜率。对于性别的影响，在调整了模型 
中其他协变量之后，女孩(性别= 0) 处于或者超过类别1的 
可能性是男孩的 exp (+0. 5002) = 1. 65倍，而且该比数比在 
所有隐含累积 logit 中保持一致。因为仅有两个水平的解释 
变量的事件是互补的，我们也可以轻易给出对男孩作用的解 
释: 在调整了其他协变量之后,男孩处于或者高于某一给定 
熟练度类别7的可能性是女孩的 exp (-0. 5002) = 0. 606倍。 
对于除了少数族裔以外的其他解释变量，一旦考虑进自变量 
的编码，它们的作用则与表 4. 5中的全 C 0 模型呈现出等价。 
例如，全 C 0 模型中性别的斜率是 一0. 500,比数比是 0. 607。 
PP 0 模型中那些比例比数假设得以保留的变量的作用与那 
些 C 0 模型中的处于相同的量级和统计显著性。方向发生了 
变化是因为 SAS 的 GENM 0 D 过程提供了解释变量编码为0 
而非1的值的估计。需要注意的是，分类自变量的编码实质 
并没有影响 C 0 模型和 PP 0 模型间连续变量的结果。 

简要总结一下 PP 0 分析，该方法的确解决了围绕全比 
例比数模型的一些问题，尤其是少数族裔变量。 GEE 估计与 
在二分 logit 模型中以量级和统计显著性两种方式同时检验 
的少数族裔的单独作用对应得非常好。在早期阅读能力的 
研究中，该结果经得起进一步的考察。而另一种做法，即生 
成一个将儿童以种族/民族群组分类的变量并将其纳入这些 
模型，而非将所有“非白人”儿童放在二分法的一个赋值中， 
也值得进一步检验。但这不是当前叙述的重点。服从比例 
比数假设约束的变量的作用与早些时候的 C 0 分析结果中的 
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变量作用一致。当前还没有对由 GENMOD 提供的 GEE 分 
析 (Stokes et al . ， 2000) 的拟合优度的总体概要检验，但是在 
“评估拟合优度的指标”标题下的输出结果中的标准表明，偏 
差(通过比较拟合模型与完美，或者饱和模型而得到）比它的 
自由度要小(值/自由度< 1) ，这暗示着模型拟合的充分性 
( Allison , 1999)。当模型中有连续变量时，没有模型偏差的 
可靠检验。然而，这些统计量对竞争模型间的比较很有用。 
总之， PPO 模型看起来比 C ◦模型更有信息量，尤其是考虑 
到少数族裔变量的解释时。 
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第1节 I 连续比例模型概述 


如在第4章所看到的，累积比数模型使用所有现存的数 
据来评估自变量对处于或者超过(抑或相反，处于或者低于） 
某特定类别的对数比数的作用。比数是通过考察处于或者 
高于某类别的概率相对于低于该类别的概率而得到的。 C 0 
分析的一个限制性假设是，在所有的累积 〖 ogit 比较中，自变 
量的作用是类似的;也就是说，处于较高的类别相对于低于 
它的任意类别的比数在不同类别间保持恒定。然而，这些累 
积比数的 logit 比较在理论上也许并不是在每个研究情境中 
都合适。如果研究兴趣在于判断自变量对处于更高阶段或 
者类别的事件的作用，就包括了所有未能进入某一类别的人 
的比较群组也许并不能让我们达到对数据最好的结论或者 
理解一以一种处于低类别的和所有更高类别的人们间的 
差异的形式。与其将所有未能进入任一类别的人群归组到 
一起，不如采取一种替代的定序方法，即将那些在任意已知 
类别的响应者与那些取得更高类别分数的响应者进行比较。 
这种方法形成了称为连续比例 ( CR ) 模型的一类模型 。 CR 
模型分析的焦点在于理解区分那些达到了某一响应水平但 
是并没有继续向前的人与那些确实达到了更高水平的人之 
间的区分因素。福克斯 ( Fox ，1997:472) 将该过程称为一系 
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列“嵌套二分类 ” (nested dichotomies ) 分析。 

连续比例是一种条件概率。接下来的讨论将解释这些 
连续比例是如何根据研究者的目的而以不同方式形成的。 
呈现的例子是基于采取 S , = P (超过类别 j 的响应 I 至少在 
类别 j 的响应)形式的连续比例，或者它的互补形式 1_ S , = 
P (处于类别 j 的响应 I 至少在类别的响应)。 

阿姆斯特朗和斯洛 (Armstrong Sloan , 1989)、麦卡拉 
和尼尔德 (McCullagh & Nelder , 1983) 、格林兰 （ Greenland ， 
1994) 以及阿格雷斯提 （ Agresti ， 1990, 1996) 都已经深人讨 
论并强调 CR 模型和由考克斯 ( Cox ，1972) 提出的比例风险 
模型之间的关系。比例风险模型在流行病学和生存分析研 
究文献中是常见的模型，但是它的价值可以扩展到其他情 
境中。 

CR 模型可以通过使用适当重构的数据集进行拟合，可 
以是 logit 关联函数也可以是互补双对数 （ clog - log ) 关联函 
数。重构的细节稍后解释，其实质是，从 K 一 1个子数据集中 
产生出一个新的数据集，其中，一个人的数据行与他或者她 
的结果分数一样多。该过程类似于为了偏比例比数分析而 
产生联结的数据集 （concatenated date set ) 的过程，重要的一 
点例 外是: 纳人数据集的标准基于是否达到了特定熟练度水 
平。得到的数据集对应于表 4.1 中连续比分析的特定比较。 
一旦数据集联结起来，在已知已经至少取得那个类别的熟练 
度时，兴趣的结果就在于儿童是否超过某特定类别。以这种 
方式取得的数据集是条件独立的 （Armstrong &• Sloan , 
1989； Clogg &- Shihadeh , 1994； Fox , 1997) ，因此，重构的数 
据集可以通过二分结果的统计模型来分析。 
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定因变量的 icebUc 回归模型 


为了推导出所需的条件概率，对数据进行重构是必须 
的，在互补双对数关联情形下则是为了得到风险 （hazard)。 
在流行病学文献中，风险比也被作为相对风险 (risk); 它是两 
个风险的比值，而风险是明确的条件比例。另一方面，比数 
比是两个比数的比值，而比数是互补概率的商 p/(l _ P) 。当 
然， logit 模型中因变量取值的概率也可能是条件概率，它澄 
清了 logit 关联对连续比模型的有用性。我们在下面的例子 
中可以看到，两种关联函数有一些相似性，但是结构上却是 
不同的。 

第一步，使用 logit 关联,被称为 “logistic 连续比例模型” 
(Greenland, 1994:1668)。模型将事件的次数作为离散量处 
理。定序结果 Y 并非必须为次数化的变量，接下来的讨论将 
会说明这一点。对于 ECLS-K 一年级数据，这个“次数”可以 
概念化为每个人在六个结果的各个不同水平来测量。让 K 
=6个响应类别代表超过类别）的事件可能会发生的“次 
数”。进而每个人最多可能有 K 一1 = 5个事件发生的机会 
(因为没有观测到基于离散定序结果的样本中有人超过最高 
的类别）。对于每个人的每一次，高于类别 j 的事件，要么发 
生，要么不发生。产生两个新的变量 ：次数 一也称为“水 
平”或者“阶 段”; 以及结果——接下来的讨论中称为“超过”: 
要么儿童超过了特定水平 （1) ，要么儿童没有超过特定水平 
(0)。通过对数据集的简单重构(下面展示)和 logit 关联的使 
用，这种方法的结果在概念上类似于并接近于离散比例风险 
模型。使用 logit 关联的 CR 模型提供了儿童在已经达到或 
者超过某个类别的条件下超过该特定类别的比数。与累积 
比数模型类似， logistic CR 模型假设可以用来呈现数据的各 
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个嵌套二分模型的斜率是同质性的(见表4.1)。在这种情况 
下，约束被称为等斜率或者平行比数假设。 

第二种方法是将事件的次数作为连续量。在这种情况 
下，对重构数据集使用的是互补双对数关联，模型提供的是 
“连续次数下隐含的比例风险模型估计” （ Allison , 1995： 
212) 。模型假设风险而非比数，在结果比例的各个层次上是 
平行的。与比例比数假设类似，平行斜率(或者风险)假设意 
味着解释变量的作用被设为在结果类别间是相等的。 

比例风险模型在响应变量为定序时尤其有用，因为从群 
组连续模型中估计的变量作用,与使用互补双对数关联时的 
连续比例模型中的作用估计是等价的，之前考察的累积比数 
模型是一■个例子 （LaarS &• Matthews , 1985; McCullagh &- 
Nelder , 1989)。 本德和本纳 （Bender Benner , 2000:680) 
将群组连续模型类别定 义为： 

“群组连续模型” (grouped continuous model ) 的名称 
可以以如下观点 解释: Y 是一个隐含的由分割点 j 所定 
义的潜在连续特征的离散变量，进而再以累积概率 g , 的 
形式形成模型。然而，假设一个潜在连续变量的存在进 
而使用累积概率来描述定序类别在本质上也并不必要。 
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定序西 变置的 logistic 回归横型 


第2节 I 关联函数 


第3章描述了关联函数，采用的是将观测响应的变式 
(transformation of the observed respinses ) 与原始数据“关联” 
起来的形式。对于 logit 关联，作者首先将结果看成是某一类 
别的概率的形式，称之为“成功”。接下来，我们得到成功的 
比数，最终的变换涉及取这些比数的对数形式。令 Wz ) 表示 
给定一系列协变量 X 的情况下成功的概率， logit 关联函数可 
以写成： g ( y ~> = ln [^ r ( x)/(l —7 r ( x ))] o 基于此 logit 关联，我 
们拟合一个线性模型，从而成功响应的 logit 预 测为： g(y) = 
a + ftX rt + AX 2 十…+疼；^。如果使用 logit 关联，则 logistic 
分布是该过程的倒数，所 以： 7t(x) = exp(g(y))/ll + 
exp ( g (: y ))]， 因而 logistic 回归模型提供了对成功或者失败 
原始概率的估计。相比其他关联函数， logit 关联通常更受青 
睐，因为它以比数和比数比的形式解释结果更简洁。 

logistic 分布函数提供了自变量和二分结果之间关系的 
合理评估，但它不是唯一可供使用的分布。对于二分数据， 
其他同等效力的关联函数及其对应的分布包括 probit 关联 
函数以及它的倒数一累积标准正态分布，互补双对数函数及 
其倒数，极值分布。福克斯 （ Fox ，1997) 提供了这些变换的 
大致描述，有兴趣的读者也可以参考布鲁雅 （ Borooah ， 
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2002)、麦卡拉和尼尔德 (McCullagh &• Nelder , 1989) 以获得 
关于这些以及其他关联方法的具体信息。 

互补双对数关联函数对转换的响应以如下方式 建模： 
g ( y ) = log (- log ( l -^( x ))), 这里 ; r ( 20 代表给定某系列协 
变量时“成功”的概率。在连续比模型中， ^( x ) 是条件概率， 
即 7 T (2 S ) 代表的是某人一旦取得某一特定阶段后继而超过该 
阶段的概率，或者是它的互补，即某人在取得某一特定阶段 
后并没有超过该阶段的概率。基于该变换的线性模 型是: 
g (^) = a + A ^,. + A &+ …+爲\。如果使用互补双对数 
关联，该过程的倒数是极值分布，于是 ； r (20 = 1 — 
exp (— exp ( g (; y )))。 
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定序因 变置的 logistic 回归模型 


第3节 I 相关的概率 


CR 模型的兴趣概率是在已知某人已至少取得任意特定 
类别时，超过该类别的概率，$ = P ( Y , >类别 j I Y , 彡类别 
j )。 这些比例是条件概率，而非累积概率，预测条件概率的过 
程也不同于 CO 模型中使用的过程。尤其是，随着^/的增加， 
所有小于7的响应个案都被各个 logit 比较的模型舍弃。注 
意4的互补1 _色，等于1 一 p ( y ,> 类别_； I y , 彡类别 )_) = 
P ( Y , =类别 I 类别 J )。 这实际上是通过比例风险模型 

寻求的概率。如果次数是连续的，而我们的兴趣在于对事件 
发生的次数(用: r 表示)建模，则风险比例描述的是已知: r 尚 
未发生时， T 将在任意间距(可能会非常小）内发生的概率。 
如阿利森 ( Allison , 1995) 所描述的，通过对概率求极限得到 
风险： 


hit ) = lim 


P«TO) 

Ai 


在某种意义上，该极限在 P ( T=H 处收敛，这也 

是为何风险有时候也被称为失败率。坦巴克尼克和芬戴尔 
(Tabachnick &- Fidell , 2001: 779) 将风险率或者失败率描述 
为“未能存活到某间距中点的比例，已知在间距开始处存 
活”。在定序结果的情形下，存活意味着当达到^/水平后继 
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续朝着超过该水平的响应移动的情况，而未能生存意味着某 
人在达到 J 水平后在水平 j 处停止并不再向前，与生存时间 
不同，我们是生存事件一已知已达到类别 J 时，个人要么 
超过该类别 J +， 要么没能超过。那些未能达到类别 J 的人在 
早些时候就失败了，因此不会包括在超过他们最后取得的阶 
段的概率计算中。这些估计概率可以通过使用连续比例模 
型直接得到。 

为了得到连续比例模型，数据必须重构以反映每个个体 
是否在每一个响应水平上存活。之后，发展岀使用 logit 关联 
的 CR 模型与比例风险模型的方法是一致的。通过 logit 关 
联模型获得的概率估计了“正存活着”的条件概率，即已知已 
至少取得某特定掌握的程度，在早期阅读连续体上取得更高 
阶段的概率。当对同样的重构数据集使用互补双对数关联 
函数时，分析等价于离散时间比例风险模型 ( Allison , 1999)。 
对于 ECLS - K 数据，通过重构数据集的互补双对数关联模型 
得到的概率也是条件概率，估计的是已知至少取得某给定水 
平的掌握度，再沿着早期阅读能力连续体水平超过更高阶段 
的概率。接下来的例子将会描述，使用互补双对数关联的模 
型斜率估计等价于在累积比数分析中对原始数据使用互补 
双对数关联 （LiiarS & Matthews , 1985)。 
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定序 S 变董的 logistic 回归 « {型 


第4节 I 因变量的向性和 
连续比例的形成 


在思考一些例子之前应该意识到，定序结果的编码方向 
选择很重要，因为该选择在连续比例方法中变得极为重要。 
编码本身完全由研究者决定，在这个意义上只要保持方向的 
一致性则其他部分完全可以是随意的。例如，数字0, 1， 
2,…，5是用来表明是否掌握早期阅读能力（表2.1)。也可 
以使用相反的情况，例如，0表示取得5级的掌握度，而5代 
表未能取得1级的技能。早些时候我们在累积比数模型中 
看到，对结果的解释在相反的编码方案中仍然完全相同，尽 
管斜率所代表的作用的方向也是相反的(例如，与全 CO logit 
模型中性别的斜 率是一 0. 500相反，如果结果变量使用相反 
的编码体系的话，则斜率将会是 + 0. 500)。 SAS 中升序和降 
序选项仅改变兴趣结果建模的方式。例如，在 C 0 模型中如 
果使用降序选项的话，我们得到 P ( Y > 类别 ）) 而非 P ( Y < 
类别_/)。在 C 0 模型中，变量的作用并不会因为结果如何编 
码而发生变化。然而，当我们开始考虑条件概率估计时，我 
们推导出的模型以及它们的解释则明确依赖于这些定序结 
果的编码方式——要么增加要么减少。只要谨慎的分析者 
意识到他或她想要从数据中探询的问题并对应于这些问题 
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正确地设置定序结果的编码，那么就不会混渚。在以下例子 
中，这种对应将会更明显。 

有若干种建构连续比例模型的独特方式，它们被称为 
“向前的连续比例”或者“向后的连续比例 ” (Bender Ben ¬ 
ner , 2000； Clogg &- Shihadeh , 1994； Hosmer &- Lemeshow , 
2000)。 这些特点不会通过简单地将结果类别的顺序颠倒而 
得到，因为结果编码颠倒后 CR 模型并非不变 （ Allison ， 
1999； Greenland , 1994)。这里呈现的模型使用的是向前的 
方法，它是与六个层级结构的早期阅读能力类别的进步过程 
自然对应的。尤其是当兴趣在于对已知第；个儿童已至少取 
得某一特定类别，他或她会超过该类别的概率进行建模时。 
对于解释变量的集合， X ，兴趣概率是 P ( Y , >类别 I K >类 
别 j ， is )。 注意，该事件的互补是 i - p ( y ,> 类别 J I 1>类 
别 ), x ) = P ( Y , =类别 j | Y ,> 类别 j , x ) 0 稍后将会展示 
这种向前连续变量的特殊构造是如何与使用原始数据的互 
补双对数关联分析结果相一致的。 
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定序因变量的 lOgBtk 回归棋型 


第5节 I 使用 logit 关联和重构 
数据的连续比例模型 


对于 ECLS - K —年级的例子，我们首先以这些条件概 
率的形式重新考虑原始数据，如表 5. 1中提供的单个解释 
变量性别。令要求的概率 P ( Y , >类别 j | Y ,> 类别 j ， 
2) 用色来表示， J ' = 0, 1，…，5。已知处于某类别或者更 
高，再超过该特定类别的比数，通过计算$ / (1 _ $ ) 得到。 
从表 5. 1中我们可以看到，男孩和女孩超过某一特定熟练度 
水平的条件概率$，通常在类别间都是降低的，尽管男孩的 
5,在类别3和类别4间稍微上升。从总体上看，随着取得更 
高的早期阅读技能，儿童愈加不大可能超过更高的类别。对 
于男孩，已知超过的可能性小于女孩超过的可能性。表 5. 1 
中男孩和女孩的比数对应于这些观测的条件概率模式。通 
过这些数据，女孩超过的比数，以她已经取得某给定的熟练 
度水平的事件为条件，总是比男孩对应的比数要大。这些数 
据的比数比(男孩对女孩的）看起来并不类似。男孩的超过 
比数是女孩的 0. 3833到 0. 7705倍不等，直到最终阶段(类别 
4对类别5)，两个性别超过的可能相同（比数比= 0. 9477)。 

如早些时候提到的，对这些数据使用 CR 模型拟合的过 
程涉及将这些数据重构以使得每个儿童有他或者她的结果 
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表 S.1 观测的 ECLS-K 性别频次 (/I, 类别概率 (P), 
以及条件概率 P( 已知至少类别_/时超过类别 )(5, ) 





类 


别 




0 

1 

2 

3 

4 

5 

总计 (/) 

男孩 

48 

163 

320 

735 

256 

151 

1673 

/ 

0. 0278 

0. 0974 

0. 1913 

0. 4393 

0. 1530 

0. 0903 

1. 0000 

P 

0. 9713 

0. 8997 

0. 7811 

0. 3564 

0. 3710 

— 

— 


0. 0287 

0. 1003 

0. 2189 

0. 6436 

0. 6290 

— 

— 


48 

163 

320 

735 

256 

151 

1673 

女孩 








/ 

19 

115 

274 

747 

331 

206 

1692 

P 

0.0112 

0. 0680 

0. 1619 

0. 4415 

0. 1956 

0. 1217 

1. 0000 


0. 9888 

0. 9313 

0. 8241 

0. 4182 

0. 3836 

— 

— 

1 一4 

0.0112 

0. 0687 

0. 1759 

0. 5818 

0. 6164 

— 

— 

Odds 








男孩 

33.84 

8. 970 

3.568 

0. 5538 

0. 5898 



女孩 

88. 286 

13. 556 

4.685 

0. 7188 

0. 6223 



OR 

0. 3833 

0. 6617 

0. 7616 

0. 7705 

0. 9477 

— 

— 


分数所允许的足够多的行 ( Allison ， 1999； Bender Benner , 
2000； Clogg &• Shihadeh , 1994)。 从根本上说，重构的数据 
集包含了五个联结但不同的数据集，以某儿童是否超过了各 
个类别的形式代表六个熟练程度的结果。第一个数据集包 
括了所有的观测，那些熟练度分数超过0的儿童获得一个值 
为1的新变量“超过” ( beyond ); 否则就得到一个值为0的“超 
过”变量。第二个数据集舍弃了那些没有取得至少1级的儿 
童，接下来重复以上的过程，即熟练度分数超过1的儿童获 
得一个值为1的“超过”变量，否则为0。在下一个数据集中， 
熟练度为1级的儿童被舍弃(伴随着那些更早被舍弃的儿 
童），超过熟练度2级的儿童在“超过”上得分为1，否则为0。 
最终的阶段仅包括那些至少达到了 4级熟练度的儿童，如果 
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定序 S 变•的! GSktic 回归横型 


他们继续往前进而掌握了 5 级，他们将会在“超过”上得分为 
1, 否则为 0。 本例中，在类别 3 上停止并出局(停止被测试） 
的儿童将会对联结数据贡献 4 行的信息，其“超过”分数分别 
是1，1，1和 0, 分别代表着从 0 类到 3 类的进步过程。附录 
中的句法 C 1 展示了如何在 SAS 中生成这些重构数 据集； 同 
等的过程也可以在 SPSS 中实现。总体上，重构数据集的总 
体样本规模将会对应于每一步所包括的人数。对于 ECLS-K 
例子，这就 是《=1\/(0)+2\/(1)+3\/(2)+4父 /(3) 
+ 5 X (/(4)+/(5)) = 13053。 

“超过”变量现在是新的兴趣结果变量。我们感兴趣的 
是控制了阶段(或者数据集或者条件 logit 比较)时的 P (超过 
=1) ，可以通过降序选项和 logit 关联在 SAS 的 LOGISTICS 
过程实现(句法 C 2)。 在重构句法中， “ crcp ” 项（连续比数分 
割点的首字母缩略词)表明所指的是哪个 logit 比较或者数据 
集或者阶段（类别）。这些变量再被虚拟编码 （ dumciO 到 
duincrS )， 在分析中将最终比较作为参照。仅有性别作为预 
测变量的二分 logistic 模型的概要结果在表 5. 2中呈现，该表 
也包括了五个仅有性别的二分 logistic 回归结果，这些回归 
对应于稍早在表 4. 1中呈现的各个嵌套的连续比例分割。 
因为这些模型本质上不同于第4章呈现的 CO 模型， CO 模型 
和 CR 的 logit 关联分析的斜率不应该拿来做比较。 CR 和 
CO 的 logit 关联模型预测的是非常不同的概率集。 

在解释 CR 分析的结果时，首先要提出的问题是模型是 
否拟合。这有两部分的含义:（1)模型总体拟合，可以通过比 
较拟合模型和虚无模型，或者是截距模型的似然值; （2) 在不 
同响应水平比较间考察 logit 模型的平行比数假设，或者均等 
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斜率假设。 

如表 5. 2中所见，拟合模型比虚无模型能更好地再现数 
据， g 的= 4070. 84，/> < 0. 0001。这对各个单独的隐含条件 
logit 模型也都成立，除了最后的比较，即处于4级和5级的 
儿童间的比较。因此，考察全局 logistic CR 模型的简洁性相 
对于用分开的模型同时拟合是否更好地代表了数据就显得 
很有理由了。该考察也将提供对平行比数假设的综合检验。 


表 S.2 使用重构数据集的 CR 模型 (logit 关联 ）, N= 1053; 
以及五个条件二分 logistic 回归模型的各个 logistic 回归结果 
(P ( 趄过类别 A 响应至少在类别 i > ) 



CR 

0 vs. above 

1 vs. atcve 2 vs. above 3 vs. above 4 vs. above 

Intercut 

-0.3763** 

4.478** 

2.606** 

1. 545** 

-0. 330** 

-0.474** 

dumaO 

4.4248** 






dumcrl 

2.9113** 






dumcr2 

1.9283** 






dumcr3 

0.0578 






gender 

-0.2865** 






(OR) 

Motfel fit 

(0.751) 

(0.384) 

(0.662) 

(0.762) 

(0.770) 

(0.948) 

-2LL(model) 

10021.534 

643.899 

1896.43 

2985.67 

3233.103 

1251. 899 

■iidf) 

4070.84 b C5) 

13.568(1) 

10.683(1) 

8.830(1) 

9.740(1) 

0.157(1) 


p<0 .0001 

/ ><0.001 

p = 0 .001 

p = 0 .003 

p = 0.002 

p = 0. 692 


注似然比卡方。 
h 该检验是基于《 = 13053 个观测。 
01。 


与偏比例比数模型类似，也可以产生自变量性别和代表 
连续比数分割点的各个虚拟编码变量之间的交互项。如果均 
等斜率假设成立，就不应期望交互项能够必然改善模型的拟 
合。如果有自变量和分割点间的交互项，就表明自变量的作 
用在分析的分割点间不是同质性的。通常，解释变量和分割 
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点指标编码之间的交互项能够用来产生无约束的 CR 模型，在 
其中所有解释变量的作用被允许在不同分割点间变动;抑或 
是产生偏 CR 模型，在其中平行性的假设被放宽到仅对解释变 
量的子集。这种方法反映了第 4 章中呈现的无比例或者偏比 
例比数模型。 

再将四个交互项加到六个参数的附加模型上。交互模型 
的最终是 10011. 002( 分析未予展示），均等模 型是一 
2LL— = 10021. 534 。 它们的差异是 10. 532 及四个自由度(加 

到模型上的交互项个数)。该差异超过了临界乂,。.。 5 =9.49, 
但没有超过= 13.28。考虑到大样本规模，我们有理由 
假设交互项的一组斜率在统计上并没有显著不等于0。然而， 
单个二分 logistic 回归的斜率估计和比数比提供了关于性别在 
不同响应水平上的有用信息，这些信息与通过全局或者更简 
洁的 CR (无交互的)方法并不明显。也许我们需要额外的解 
释变量，但亦可能是平行比数的假设不适合数据。尽管平行 
比数假设在 a = 0. 05水平上边际显著，但为了教学的目的，我 
们将继续探讨与均等斜率假设下的 CR 模型相关联的统计量 
和结果。 

注意，表 5. 2 中单独的二分 logistic 回归模型的变异 
(_2LL (模型 )） 总和与以上描述的交互的 CR 分析的模型变 
异相等 （ S[_2LL (模型)]= 10011.002 )。 嵌套的二分体 
(nested dichotomies) 是独立的 (Fox ， 1997) ， 因此，“各个 G 2 (变 
异)统计量的总和是与同时拟合模型相关的总体拟合优度统 
计量” (Agresti ， 1996:219 )。 

为了更进一步考察平行比数的假设，我们需要回顾一下 
来自单独二分 logistic 回归的斜率和比数比，并将其与 CR 的 
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结果做非正式比较。作为替代，采用一种类似于将多个模型 
变异相加的过程，对 CR 分割系列模型中的每个变量都执行将 
Wald 检验统计量相加的方法 ( Fox ， 1997)。无论采用何种方 
法，回顾单独分割的 logistic 回归结果总是明 智的; 这也是此处 
采用的方法。 

回到表 5. 2的估计 ， logistic CR 模型的性别作用是 
— 0. 2865(/) < 0. 01) ，对应的比数比是 exp (— 0. 2865) = 
0. 751 。该比数比概述了早些时候在原始数据中看到的趋势 
(表 5. 1) : 男孩相对女孩不大可能超过某一特定的熟练度水 
平。为了计算条件比较的估计比数比，可以用 CR 模型来计 
算 logits 。 在所应用的虚拟编码方案中将最后的比较作为参 
照，我们可以用截距来得到超过熟练度 4 级的 logit ， 也 就是： 
对于 （Y > 4 | Y > 4) 的 log ^ =—0. 3763+(—0. 2865 X 性 
别）。对于男孩 ， logits =- 0.6628 ； 对于女孩 ， logits = 
_0.3763 。通过这些值，可以得到估计的条件概率。对于男 
孩， S 4 = [exp(-0. 6628)/(1+ exp(-0. 6628)] = 0. 3401 ； 
女孩的 i 是 0.4070 。最后可以得到男孩和女孩的比数比， 
并计算出估计的 OR 4 = 0. 7509 。所有比较的预测在表 5. 3 中 
概述。使用 CR 模型，所有连续比例分割点的比数比都相等 
并大约等于 0. 75 。 CR 模型将这些比数在相继的条件类别比 
较间约束为相等。 

将表 5. 3中从 CR 模型中估计的比数比与实际的性别比 
数比相比较，我们可以看到，定序熟练度尺度的中间具有比 
两端更大的相似性。尽管共同比数比是预期的方向，并且总 
体模型可以解释为表明男孩对于女孩更不大可能超过任何 
熟练度类别，这种变量作用同质性的缺乏需要研究者在模型 
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简洁性和明确阐述变量作用之间作出决定。 


表 5 . 3 p(y > j | y > j) 的观测比例 (8j >,预测和观测的以及估计的 
性别模型的比数比 , logit 关联的 CR 分析 





类 

别 


0 

1 

2 

3 

4 5 

男孩 






Si 

0. 9713 

0. 8997 

0.7811 

0. 3564 

0. 3710 

logits 

3. 762 

2. 2485 

1. 2655 

—0. 6050 

一 0.6628 — 

Si 

0. 9773 

0. 9045 

0. 7798 

0. 3532 

0. 3401 — 

(1-Sj) 

(0. 0227) 

(0. 0955) 

(0. 2202) 

(0. 6468) 

(0.6599) 

女孩 







0.9888 

0.9313 

0. 8241 

0. 4182 

0. 3836 

logits 

4. 0485 

2.535 

1.552 

-0.3185 

-0. 3763 — 

Sj 

0. 9829 

0. 9266 

0. 8252 

0. 4211 

0. 4070 — 

(1-8j) 

(0. 0171) 

(0. 0734) 

(0. 1748) 

(0.5789) 

(0. 5930) 

OR(obs.) 

0. 3833 

0.6617 

0. 7616 

0. 7705 

0. 9477 — 

OR(est ) 

0. 7490 

0.7502 

0.7501 

0. 7508 

0. 7509 


从表 5. 2中条件数据集中得到的二分 logistic 回归模型 
可以看到，更多关于性别效应异质性的证据，在量级和统计 
显著性两方面都是如此。对于二分模型，性别对对数比数的 
作用范围在_0.054到_0. 956之间，平均的斜率是_0. 391。 
该平均斜率对应的比数比是 0. 676。对于最后一个二分 logit 
比较 （ Y >4 | 7>4)，性别的作用在统计上并不显著，它的 
比数比接近1。尽管 CR 模型给出了不同类别间性别效应的 
简洁描述，而且平均来讲它与单个的拟合看起来也相对应， 
但在使用拟合的 CR 模型时还是有一些顾虑。在一些研究情 
形下，呈现并讨论单独的比较也许比仅关注于 CR 模型全局 
化的结果更加符合情理且信息量更多。 

CR 模型的目的是在已知已达到或者超过该熟练度水平 
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的情况下，考察超过某一给定熟练度水平的概率。表 5. 3中 
模型的预测应该充分地再现了与各个连续比例相关联的观 
测条件比例 I YSj )。 基于 CR 模型分析的结果，其 
将性别的作用在连续比例分割点间约束为均等，模型的预测 
看起来与观测到的条件概率非常接近，对男孩和女孩都是如 
此。为了今后的参考，表 5. 3也提供了估计的互补概率。这 
些互补概率是 P(Y = ; ' | ，来自作者之前对风险或者 

失败率的估计的讨论，也即未能超过熟练度类别 ） 的概率。 

这些数据的 Somer’s D 是 0. 691，表明在超过某给定类 
别的观测概率和预测概率之间良好的对应，尽管这个等级相 
关系数 ( rank-order correlation coefficient ) 是重构的二分结果 
数据而非原始定序因变量的。似然比!?【= 0. 289,表明 CR 
模型相对于虚无模型或截距模型在变异上的适当 缩小; 再 
次，该系数是针对重构的二分结果数据集的。 

为了通过 r p 和 A p 考察预测有效性，可以使用估计的条 
件概率来构建分类表。 SAS 将会把 N = 13053个个案的每 
个 P (“ 超过” = 1) 存储到重构的数据集中。然而，将该数据 
集汇总到原始规模的样本是有问题的，因为仅有那些包含在 
各个条件比较的人群才会在那个分割中有预测。因此，生成 
分类表的简便办法是将模型估计输人统计软件并在原始数 
据集中使用这些估计 （JV = 3365) 来计算基于性别的 logit 。 
然后 logit 可以被转化为条件比例 ， t = exp ( logitj )/ (1 + 
expdogitj )), 于是各个儿童都有一个对每个条件比较 P(Y 
>类别州类别 _；') 的估计，该过程将得到与表 5. 3中相 
同的估计。 

于是可以使用以下方程式得到类别概率 (Laara & Mat - 
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thews , 1985) : 


(l-5 ; (x)) = 


?r,(x) 


这里 S , ( W = P ( Y > 类别 j \ Y ^ 类别 j , x ),^( x ) = 
P ( Y = 类别 j I x), y ; (x) = P(Y< 类别 ； I x) =^„(x) + 
A (2) + A ( X ) + … + 巧(各) 。移项 以求得类别概率巧（2£)，得 
到： ffj ( x ) = ( l - s / sDxa —^ u ))。 这就得到六个类别 
概率，响应变量的每个水平各一个。个体类别属性被指派到 
该儿童所拥有的最大概率的类别上。该过程的句法在附录3 
的句法 C 8 中可以找到。 

对于仅有性别的模型 ， logistic CR 模型将所有的儿童预 
测到类别3。这与第4章的 CO 模型类似 ， rp = 0. 23, A p = 
0。尽管估计概率的模式可能是有信息的,但单变量模型看起 
来在熟练度分类精确性上不是很有用。然而，这里所勾画出 
的方法可以应用到更复杂的 CR 分析以及其他定序数据集中 
领域中。 
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第6节 | 使用互补双对数关联的 
连续比例模型 


由于其与隐含的二分 logistic 回归模型的直接对应关系， 
logit 关联函数经常在需要连续比数模型的研究中使用。一个 
替代的关联函数是互补双对数 ( clog - log ) 关联函数，它以风险 
比而非比数比的形式提供对结果的解释。附录3的 C 3 中包 
括了使用重构数据集的互补双对数关联 CR 分析的句法，与之 
前的 logit 关联分析相比有两处变动。第一，关联要求是互补 
双对数。第二，为了将模型估计的参数解释为风险比率，使用 
的是升序方法而非降序方法。也就是说，对于重构的数据集， 
我们希望预测的是 P (“超过” = 0) 而非 P (“超过” = 1) 。 

条件概率 P ( y ; =类别>类别 j ) 提供了对风险的 
估计。使用互补双对数关联的升序选项，该估计概率是 logit 
关联模型的 互补; 也即 logit 模型估计的是超过类别 _；' 的条件 
概率，或者是 P ( y , >类别 j I Y ; >类别 j ) ,而这里构建的互 
补双对数模型估计的是在类别上停止并退出的条件概率 
P ( Y ,= 类别 ） | >类别。这种对应允许两种关联函数估 
计的连续比例和/或它们的互补可以直接比较。不用升序选 
项时，拟合的互补双对数模型会估计岀一套完全不同的条件 
概率，名义上是 p ( y , <类别糾 y , <类别 ）） 。我们必须谨慎 
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行事以确保合适的兴趣事件(这里是 y =类别 j I 类别 
j ) 以及它的互补(这里是类别 d 类别乃与研究者 
所感兴趣的预测相匹配。表 5.4 中的前两列提供了使用 
SAS 的 logistic 回归过程的分析结果。 


表 S.4 使用互补双对数关联的 CR 模型参数估计， 
基于重构的数据集 iV = 13053, 以及原始数据集 JV = 3365 


重 

构 

原 

始 

Intercept 

-0. 1166* 

Intercept 。 

-4. 0091** 

dumcrO 

-3. 8924** 

Intercept 1 

一 2. 3257** 

dumcrl 

-2. 4146** 

Intercept2 

- 1 . 2173 〃 

dumcr2 

-1. 5013** 

Intercept3 

0.1444** 

dumcr3 

-0. 0350 

Intercept4 

0.7155** 

性别 

Model fit 

0.1976** 

性别 

0.1976 

— 2LL(model) 

10026. 201 


10026. 201 

— 2LL(null) 

14092.374 


10053. 980 

x z ( df ) 

4066. 173** (5) 


27. 7511** (1) 


注 ： * /> < 0. 05 ； * * p < 0. 01 o 


互补双对数关联函数转换观测概率的方式与使用 logit 关 
联的方法非常不同。通过互补双对数关联函数得到的值不是 


比数的对数，而是风险的对数，因此它代表了比例风险模型。 
与前一部分表 5. 1 中的 logit 关联类似，响应变量基于条件概 
率 转换： 类别 j | Y 彡类别 j )。 然而，这里 logit 被 
定义为比数的对数，互补双对数被定义为互补概率负对数的 
对数： clog-log = log [— log(l — 户)]。 为了使用互补双对数预测 
将数据还原到条件概率，使用该过程的 倒数 ： phat = 1 — 
exp [— expCclog — log )] 。 因为在比例比数模型中，对数据有一 
项限制性假设 :比例 风险。该假设要求风险[风险= exp ( clog - 
log ) ] 在响应变量的各个不同水平上保持同质比例性。 

基于附录 3 中的句法 C3, 我们可以从表 5. 4 中的结果概 
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要看到模型拟合得比虚无模型好 ， W = 4066.173, p < 
0. 0001。在该分析中，性别对互补双对数的作用是 +0. 1976, 
统计上显著不等于0(々 < 0.01)。 Singer 和 Willett ( 2003： 
424) 指出不论选择何种关联函数，我们都将模型中的估计指 
数化以方便解释 :“一 个来自 logit 关联模型的反对数系数是 
比数比，而一个来自互补双对数关联模型的反对数系数是风 
险比。”将当前模型的性别作用指数化，我们得到风险比 HR 
= exp (0. 1976) = 1. 218。对于从0到5的所有响应水平，男 
孩处于特定类别 J 而非超过它的风险，而女孩被假设为固定 
在 1. 28。为了理解这对数据意味着什么，互补双对数模型的 
模型估计和预测概率在表 5. 5 a 中提供。记号 hg , 用来表示 
基于互补双对数关联模型的预测条件概率以区分通过 logit 
关联分析估计的条件比例。 


表 S. Sa P{Y>j\Y>j) 的观测比例 (8 ; >, 预测 , 估计风险和互补， 
以及性别模型的估计风险比，互补双对数关联的 CR 分析 ( 使用重构数据集 ) 





类 

别 



0 

1 

2 

3 

4 5 

男孩 

〜 (obs) 

0.9713 

0. 8997 

0. 7811 

0. 3564 

0.3710 — 

clog-log 

-3.8114 

-2. 3336 

— 1.4203 

0. 046 

0.081 

hs. 

0. 0219 

0. 0924 

0. 2147 

0. 6490 

0. 6619 

1 — hS ; 

0.9781 

0.9076 

0. 7853 

0. 3510 

0. 3381 

女孩 

^j(obs) 

0. 9888 

0. 9313 

0. 8241 

0.4182 

0. 3836 

clog-log 

-4. 009 

-2. 5312 

-1.6179 

-0. 1516 

— 0. 1166 — 

hS, 

0. 0180 

0. 0765 

0.1780 

0. 5766 

0. 5893 — 

1 -hS, 

0. 9820 

0. 9235 

0.8220 

0. 4234 

0. 4107 

HR a (est.) 

1.218 

1.218 

1.218 

1. 218 

1. 218 — 


注 ： = p(y = 类别丨 y 彡类别 j 〉。 

a. 风险 = exp(clog-log); 风险比 HR =( 风险 ( 男孩 )/( 风险 ( 女孩)）。 
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通过拟合模型决定的风险，能够最好地理解男孩对女孩 
的预测概率。通过升序选项，预测是针对 hS ; = P(Y = j I 
Y ^ j )； 这与 logit 关联的 CR 分析得到的预测是互补的。通 
过互补双对数模型得到的互补概率， l - hS ; = P(Y > j I 
Y ^ j ), 也在表 5. 5 a 中予以呈现。 

在这些模型里，男孩在性别上的编码是1，女孩是0。切 
割点使用的虚拟编码表明，截距对应于从 Y = 4到 Y = 5的 
不同。为了得到男孩的第一个连续比例(将 Y =0 与 
比较）的互补双对数估计，我们有（表 5. 4): clog-log s@ , 0 = 
— 0_ 1166 +(— 3. 8924) X dumcrO + (0. 1976) X 性别= 
-3. 8114。对于女孩模型估计对应于 clog-log 4a , 0 =-0. 1166 
+ (― 3. 8924) X dumcrO =-4. 009,将各个互补双对数指 
数化再取男孩对女孩的比值，得到风险比 HR = 
exp (— 3. 8114)/ exp (- 4. 009) = 1. 218。这正是模型在所有 
的连续比例比较中约束为相等的比例。基于表 5. 5 a 中互补 
双对数估计而计算出的对各个连续比例比较的风险比都等 
于1.218,含舍人误差。男孩未能超过的风险被假设为比女 
孩的大，并在条件连续比例分割点间一致。这说明男孩不大 
可能比女孩取得更高的阅读熟练水平，这与 logistic CR 模型 
的结果是一致的。 

为了考察均等斜率假设，将代表了性别和各个分割之间 
交互的四个交互项加人到模型中， -2 LL mt = 10011. 002 (分析 

未予展示），与 _2 LL ^„, = 10026. 201比较时，差异是乂 = 
15.20,超过了 乂 ,。 I = 14.86。这表明单个解释变量性别在 
不同结果类别间的风险不是平行的。然而，为了演示的目的， 
我们将继续探讨平行斜率模型参数估计和预测概率的解释。 
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表 5. 5b P{Y>j\Y^j) 的观测比例 ( 屯 ） ，预测 , 估计风险和互补， 

以及性别模型的估计风险比，互补双对数关联的 CR 分析 ( 使用原始数据集 } 





类 

别 




0 

1 

2 

3 

4 

5 

男孩 

5, 

0.9713 

0.8997 

0. 7811 

0.3564 

0. 3710 


clog-log 

-3.812 

-2. 122 

-1. 020 

0. 3420 

0.9131 

— 

c% 

0. 0219 

0.1123 

0. 3028 

0.7553 

0.9173 

— 

1-C% 

0. 9781 

0.8877 

0. 6972 

0. 2447 

0. 0827 


女孩 


0. 9888 

0. 9313 

0. 8241 

0. 4182 

0. 3836 


clog-log 

—4. 009 

—2.323 

— 1.217 

0. 1444 

0.7155 

— 

cS, 

0. 0180 

0. 0931 

0. 2562 

0.6850 

0.8707 

— 

1 -cd ； 

0. 9820 

0. 9069 

0. 7438 

0.3150 

0. 1293 


HR a (est.) 

1.218 

1.218 

1. 218 

1. 218 

1.218 

— 


注： = 累积概率。 

a. 风险 = exp(clog-log) ；风险比 HR =( 风险 ( 男孩 )/( 风险 ( 女孩 )） 。 


估计的条件概率用 hi , 表示，可以通过性别模型中预测 
互补双对数的关联函数的倒数来求得。也 就是： p-hat = hS , 
=1 — exp [— exp ( clog - log )] 0 我们可以将互补预测值 1 — h ^ 
与表 5. 5 a 中的第一行的观测连续比例相比较，它们与实际 
数据间紧密的对应关系就很清楚了。 

基于互补双对数关联的预测比那些通过 logit 关联得到 
的预测更精确吗？对于互补双对数关联，< = 0.289, 
Somers ' D = 0. 691,这与 logit 关联模型是一样的（允许舍 
人)。两种关联函数看起来都表现得很好。就预测效率来 
讲，我们可以看到两种关联函数背后相同的预测概率 模式; 
简单模型中仅有性别作为预测变量，男孩和女孩的估计熟练 
度都是 三级; 因此， r p = 0. 23且= 0。分类表是通过一种 
与 logistic CR 分析之后类似的过程推导出来的，并对预测互 
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补双对数而非 logit 求解。当生成分类表时互补概率没必要 
解岀来(如果将附录3 C8 中的句法修改），因为对于升序互补 
双对数模型预测概率已经是 h 〗， = P ( Y = 类别 7 ' I Y 彡类别 
j )。 基于预测有效性统计，没有表现出对 logit 或者互补双对 
数关联的明显偏好。然而， logit 模型的确比互补双对数模型 
更好地满足了均等斜率假定。 
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第7节 | 关联的选择和两个互补 
双对数模型的等价 


通常，在 logit 或者互补双对数关联函数下的 CR 模型拟 
合统计量能够比较，如我们在这里看到的。关联函数之间的 
选择归结到对某种方法优势的偏好问题，以及对数据如何生 
成的概念思考。 logit 关联的优势在于它以比数和比数比的 
形式来解释的简洁性。互补双对数关联的优势在于它以风 
险和风险比的形式解释，并且它的方向与比例风险模型相 
关。对于这里呈现的分析，“次数”并不是数据如何生成的结 
构性部分，所以支持 logit 方法的观点可能会更强一些。然 
而，无论哪种关联函数，特定阶段的交互可以直接包括并被 
嵌套到模型中，所以对均等斜率假设的考察可以轻易进行。 

然而，在计算上，重构大的数据集以拟合连续比例模型 
可能会变得较为繁琐，尤其是当响应变量的水平数目增加 
时。通过互补双对数关联，可以使用原始数据集，并应用前 
一章的比例比数模型。如马修斯等人 （1985) 所展示的，这种 
方法的结果可以与通过应用重构数据集的互补双对数关联 
得到的连续比例模型直接比较。两种模型得到相同的变量 
作用，可以提供以风险比的形式在数据中的直接解释模式。 
进一步说，通过这种方法， SAS 和 SPSS 都提供对均等斜率假 
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设的检验。然而，在使用重构数据集时， CR 模型提供了条件 
概率的估计，累积 CR 模型提供的是累积概率的估计。附录 
3中的句法 C 4 展示了如何在 SAS 中使用升序选项拟合模 
型; 因此，模型预测的是 P ( Y < 类别 j )。 等价的 SPSS 命令在 
附录3的 C 5 中给出。使用原始数据集的性别作为单个解释 
变量的 SAS 结果在表 5. 4的第二部分给出。 

首先要注意到性别的作用，6 = 0.1976(/) <0.01)，在 
两个互补双对数模型中相等。就解释变量的效应来说，对有 
二分结果的重构数据集使用互补双对数关联和在累积比数 
模型中使用互补双对数关联是等价的。两种方法的参数估 
计都是以风险的形式解释的。如稍早看到的，男孩未能超过 
某一给定熟练度水平的风险是女孩风险的 exp (0. 1976) = 
1.28 倍。然而，两个互补双对数关联模型的截距值并不相 
等，这通常归咎于两种模型迥异的结构。不应期望截距可 
比，因为一种模型预测条件概率(重构数据集的互补双对数 
关联)而另一种预测的是累积概率(原始定序数据的互补双 
对数关联)。以概率的形式进行的预测并不等价。 

使用互补双对数关联对重构数据的预测在表 5. 5 a 中 
给出；使用互补双对数对原始数据集的累积 CR 模型的预测 
在表 5. 5 b 中给出。回忆下预测概率是通过 p - hat = 1 — 
exp [— exp ( clog - log )] 得到的。这里，用来将之前分析的 
那些概率与这些概率进行区分。累积 CR 模型的预测可以与 
表 4. 2中的实际累积概率进行比较。从累积概率的形式看， 
模型似乎很好地反映了数据。然而，一个变量的模型的拟合 
证据却很小。该分析的 Somer’s D 是 0. 079, R [ = 0. 003。对 
于虚拟 R 2 我们得到 ： = 0. 008,^= 0. 009, rp = 0. 23, 
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A p = 0, 因为仅有性别的累积模型将所有的儿童预测到类别 
3中，不论关联函数为何。 

均等斜率假设的检验得到一个 x! = 14. 95, p = Q . 0048。 
表明参数估计在类别间不等价。布兰特 (Brant，1990) 发现 
了计分检验的若干问题，即使不考虑关联函数。大样本倾向 
于得到小的/>值，所以基于计分检验的结论可能是有缺陷 
的; 也就是说，拒绝比例比数假设的决定也许并不意味着针 
对任何或者所有解释变量的类别比较间实际含义的不同。 
此外，计分检验仅提供了对平行斜率假设缺乏拟合的全局评 
估，并没有关于违背假设的实质等信息。如在第4章中强调 
的，布兰特建议考察一下伴随着定序分析的隐含二分模型， 
目的是为了“评估模型的充分度，同时获得关于数据复杂性 
的额外洞见” (Brant, 1990:1176)。限于篇幅，尽管这里没有 
考察在互补双对数关联函数下的仅有性别的二分模型，但那 
样做还是很有道理的，可以增加从全局计分检验中获得的信 
息量。 
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第8节 | 连续比例模型的方法选择 


如我们在第4章看到的，当结果变量是定序时， logit 关 
联被用来拟合比例比数模型。使用 logit 关联的比例比数模 
型也许是社会科学研究中各种竞争模型间最常选择的，但是 
对于定序结果，也有使人信服的理由来考虑用连续比例模型 
来拟合。如我们在这里看到的，有若干种不同的方法发展 
CR 模型。从本质上说,当因变量代表相继阶段的定序进步 
时，如果变量作用是用条件概率(例如，以达到某特定阶段或 
者没有为条件)而非累积概率估计的话，则会对影响该进步 
的因素有更好的理解。由于它与隐含的比例风险模型的关 
系，互补双对数关联能够提供一个简明分析,该分析能够详 
尽地为这些变量依次对每个条件二分的作用建模。 

logistic CR 回归模型“正好是由考克斯 ( Cox , 1972) 提出 
的对离散生存分布的比例 ‘ logit 风险’模型” ( C . Cox ， 1998： 
436), 以离散时间提供风险。当使用互补双对数关联时，拟 
合模型是比例风险模型 (Ananth & Kleinbaum ， 1997)。关联 
函数间的选择应该由任一转换下所获得的结果的有用性来 
做决定。考虑到教育学和社会科学领域的诸多应用研究者 
都对 logit 模型、比数和比数比越来越熟悉，有充分的理由期 
待 logistic CR 方法将会是最适合该领域定序结果研究的方 
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法。与使用累积 CR 互补双对数模型相比，应用重构数据集 
拟合这些模型而不考虑关联函数，也许是非常明智的策略。 
重构数据集允许直接生成并纳人交互项，这与第4章 PPO 例 
子所采用的方式完全一样。在解释变量的平行比数假设不 
成立的情况下，用偏 CR 模型 (Cole & Ananth , 2001) 拟合也 
许能提供数据中作用的更好解释。 
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第9节 I ECLS - K 数据的全模型 
连续比例分析 


本章的最后一部分将提供 ECLS-K 数据的多变量 logis ¬ 
tic CR 模型的例子。 分析是由附录3中的句法 C 6 得出的， 
使用 SAS 的降序选项。兴趣条件概率是含八个变量的模型 
的 P ( y > 类别 j +丨 1^>类别7')。表5.6提供了分析的结果，表 
中还包括了对应的二分 logit 分析的结果以用于比较。 
表 5. 6的最后一列包括通过 SPSS PLUM 拟合的互补双对数 
CR 模型(风险)。为了更好地描述，这里把焦点放在 logistic 
CR 分析的结果上。 

总体来看，男孩 ( gender ; 比数比= 0. 668)，有任何家庭 
危险因素特征 ( famrisk ; 比数比= 0. 808) 的儿童，没有父母 
或者监护人为他们经常阅读的儿童 （ noreadbo ; 比数比= 
0. 763)，以及仅上半天幼儿园的儿童 （ halfdayk ; 比数比= 
0. 894) 更不大可能超过某一特定熟练度水平。家庭社会经 
济地位 ( wksesl ; 比数比= 1. 78) 以及儿童的年龄 ( plageent ; 
比数比= 1. 05) 与有着超过某一给定熟练度水平的更大似 
然性成正相关。 

这些作用中的大部分与相对应的二分模型在规模和模 
式上都是一致的。然而，也有一些明显的差异。如这里编码 
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0. 632(0. 100) 

LO 

t£> 

oo 

0. 061(0. 016) 

1.062* 

146. 74** (8) 

7. 495(8) 

0. 484 (n. s.) 

CR„ 

bCse(b)) 

OR 

0. 928 

1.005(0. 168) 

CM* 

0. 024(0. 032) 

1.025 

00 

<NJ 

OC 

7. 796(8) 

0. 454( a s.) 

Logistic CR 
b(se(b)) 

OR 

0. 894 ■ 

0. 575(0. 039) 

1. 777 - 

0. 049(0. 007) 


4548. 76** (12) 
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的少数族裔 ( minority ) ，在二分分割间的作用变化剧烈;通过 
logistic CR 模型估计的少数族裔的全局作用（比数比= 
0. 918,统计上不显著)没有充分捕捉到所有 CR 比较的独特 
作用。此外，上半天幼儿园项目而非全天项目的作用（比数 
比= 0. 894,统计显著)在 logistic CR 模型中的作用看起来并 
没有充分反映出幼儿园一天长度的潜在贡献，而这一点在二 
分 CR 比较中表现很明显。 

然而，尽管观察到不规则性 ， logistic CR 分析的模型拟合 
统计量表明模型的确提供了数据的良好拟合。该分析的关 
联测量是 Somer’s D = 0. 739, r p = 0. 23和 = 0. 002。对该 
Logistic CR 模型的合理调整包括 :把少 数族裔和人园半天这 
两项解释变量的交互项也纳人模型，同时把是否去中心的作 
用从模型中删除(无论儿童在人幼儿园之前是否参与过护理 
中心的看护）。 




相邻类别模型 
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定序因变置的回归模型 


第1节 I 相邻类别模型概述 




定序因变量变量分析 ( CO 和 CR 模型都是）的第三种方 
法是以相邻类别配对的形式同时估计解释变量的作用。相 
邻类别 ( AC ) 模型是多分类结果的一般 logit 模型的特殊形式 
(Clogg &- Shihadeh , 1994； Goodman , 1983; Hosmer &- 
Lemeshow , 2000)。 在多分类方法中，我们常在各个因变量 
的取值和一个基准类别间进行比较，通常是取最后一个响应 
类别为基准类别。多分类模型是非约束的，因此解释变量的 
作用可以在各个具体的比较中有所变动。在 AC 模型中，这 
些作用在相邻类别比较中被约束为恒等或者同质，反映了我 
们之前描述的 CO 和 CR 模型的比例性和平行性假设。古德 
曼 ( Goodman ，1979) 将这种假设称为“统一的关联” (uniform 
association ) 。 

SAS 通过 CATMOD 过程来估计 AC 模型，尽管对于包 
括了连续解释变量的模型，该分析并不是最优化的。 CAT - 
MOD 过程通过加权最小二乘法估计模型，这就要求数据以 
列联表的形式分好组 （ Allison ， 1999； SAS , 1999)。为了将 
连续变量纳人模型，克洛格和谢哈德 （Clogg &■ Shihadeh , 
1994) 采取的策略是将其类别化，但如果连续变量在不同响 
应层次间是非线性的话，这种方法对模型拟合会有影响。样 
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本中与解释变量的值类似的个体的各个属性的样本规模必 
须足够大，才能得到 AC 模型间比较的可靠估计 (Stokes et 
al . ，2000)。尽管当前为拟合 AC 模型而设计的软件存在缺 
陷,但在那些相邻类别间的比较具有更强的理论感的研究情 
境下，这种方法的确提供了 CO 或者 CR 方法的合理的替代。 

在 AC 模型中， logit 转换将; r ,, ，，也即第£个人在第^/个 
类别的概率，与在下一个后续的响应类别的概率，; r , w+1 进行 
比较。这种方法的目的是同时决定下一个最高响应的类别 
对各个相邻类别配对的比数。构建一系列的 logit 比较，对应 
于这些比较的分析在表 4. 1的最后一部分给出。我们取两 
个相邻概率的对数来产生 logit ： 

y ； =ln(^)=a,+/K, 

这里 J =响应水平的个数且 ] = 1, J - 1 . 在该式 
中，由分子和分母呈现的概率是指两个相比较的相邻类别的 
概率。/_ 1 logit 公式的截距在不同的相邻类别比较间也许 
会变化，但是解释变量的作用被假设为在不同比较间是一致 
的。斜率作用斤在 所有的 AC 模型比较间都是同质性的。 

AC 模型的比数比被称为“局部比数比 ”(local odds ratios ), 
因为他们所描述的关联是来自于总体表格的局部化部分 
( Agresti , 1989, 1996)。对于一个有两个水平0, 1的单个解 
释变量， J -1 比数比在各个具体的相邻类别对中生成 G = 1 
到 J -1)。 

p(y = j + i\x = i )/ P ( y , = j I x = l ) 

什 1 — F(Y^7+iT^oVP(y^jTr^o) 


对 AC 模型的平行性的考察大部分与之前的分析处理方 
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定序因变量的 logistk 回归模型 


式相同，但没有对约束的正式检验。如果 AC 模型不拟合，则 
可以用多分类 方法; 或者特定 logistic 回归对应于各个 AC 比 
较的分割可以分别查看约束的可信性。 

与之前的章节类似，在接下来的讨论中，仅有性别的模 
型首先模拟以描述简单 AC 模型的方法、路径和结果。下一 
步，用更复杂的模型来拟合并解释结果。两个模型的句法在 
附录4中呈现(简单的和复杂的）。 
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第2节 I 仅有性别的模型 


在附录 4 的 D1 部分呈现的句法，被用于仅有性别的 AC 
模型。在该句法以及更复杂的模型里也是，解释变量的作用 
被视为定量的，因此被包括在 CATMOD 过程里的“直接” 
(direct) 子命令下。因为性别的编码对于 SAS 来说是外部的 
(0 = 女性，1 =男性），这种方法允许考虑到解释效果的便利 
性，将解释与之前的那些 logit 模型保持一致。参见斯托克斯 
(Stokes) 等人 (2000) 对 CATMOD 过程里类别预测变量处理 
的替代但是等价的方法。“响应” (response) 语句指明了相邻 
类别模型 Ulogit)， 而且句法要求预测的 logit 和估计的 AC 概 
率写到名为 “acgender” 的文件里。最终，模型使用一个称做 
“_ reS pons e _ ”的项放在等式右边以具体化。该项将性别的普 
遍作用约束加在 AC 响应函数间。估计过程细化为加权最小 
二乘法，也要求生成一张包含了模型预测 logits 的表格 (pred)。 

早期阅读的结果有六个可能的响应(0, 1，2, 3, 4, 5); 
因此，他们有6— 1 = 5个代表相邻类别比较的响应函数。 
图 6. 1提供了通过 CATMOD 过程实现的统计分析的主要结 
果。首先，“总体概要” (population profiles) 报告了各个独特 
共变性模式的样本规模。当只有性别作为预测变量纳人模 
型中时，样本规模在这里指各个性别群体的样本规模，本表 
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定序因变•的 logistic 回归模型 


Peculation Profiles 


Saii^le 


GENEER 


San^le Size 


fffffffffffffffffffffffffffffffffffffffff 


1692 

1673 


Analysis of Variance 


Source 


GENDER 


IF 


C3u-Square 


176. 21 
1550. 56 
38. 38 


Pr>QiiSq 


ffffffffffffffffffffffffffffffffffffffffff 

Intercept 1 


<0. 0001 
<0. 0001 
<0. 0001 


Analysis of Weighted Least Squares Estimates 


Parameter 

ffrrr 

Estimate 

EjTor 

rrrrffffrrx 

Chi-Square 

Pr> ChiSq 

jJJjJJJjjJj 

Intercept 

UJJJj 

f jJJjJJJjjJj. 

0. 4323 

JJJJJJJJJJJ 
0. 0326 

jjjJjJjJJJJ 

176. 21 

JJJJJJJJ 
<0. 0001 

_RESPONSEL 

1 

1. 0952 

0. 1158 

89. 48 

<0. 0001 


2 

0. 4365 

0. 0774 

31.81 

<0.0001 


3 

0. 5823 

0. 0554 

110. 40 

<0. 0001 


4 

-1. 2670 

0. 0558 

515. 67 

<0. 0001 

GENDEK 


-0.1928 

0. 0311 

38.38 

<0. 0001 


Predicted Values for Response Functions 


- Predicted - 


GEN- Function Standard 

DER Number Function Eiror Functicn 


Standard 

Error 


Residual 

fffffffffffffffffffffffffffffffffffffffffffffffffffffffffffffff 


1 

1.800493 

0. 247643 

1. 527445 

0.139517 

0. 273048 

2 

0. 868196 

0.111109 

0. 868796 

0. 075314 

-0. 0006 

3 

1. 002937 

0. 070628 

1. 014531 

0. 051393 

一 0. 01159 

4 

一 0. 81395 

0. 066029 

—0. 83477 

0. 050661 

0. 020819 

5 

—0. 47424 

0. 088744 

-0. 41475 

0. 068319 

_ 0. 0595 

1 

1. 222549 

0.16422 

1. 334673 

0.136174 

-0.11212 

2 

0. 674571 

0. 096229 

0. 676024 

0. 073575 

-0. 00145 

3 

0. 83155 

0. 066974 

0. 82176 

0. 050663 

0. 00979 

4 

-1. 05469 

0. 072573 

-1. 02754 

0. 051874 

-0. 02716 

5 

-0. 5279 

0.10261 

-0. 60752 

0. 069586 

0. 079621 


图 6.1 简单“性别”模型的 PROCCAIMC » 结果 
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可以用来界定特殊共变模式的稀少样本。 

“方差分析”部分提供了性别在 J 一 1 = 5个 AC 响应模 
型间的性别的作用检验。对应于这个分析，性别的作用是显 
著的 ， Xl = 38.38, p < 0 . 0001。残余卡方检验表明模型的拟 
合 ， xl = 2. 96, /> = 0. 5647。这个卡方检验统计量是一个类 
似于皮尔森卡方检验的拟合优度检验，是将拟合模型与一个 
预测模型或者饱和模型进行比较。 

加权最小二乘法估计在下一部分的输出结果里呈现。 
每个相继响应函数的截距通过将各个对应的_163口01136_值与 
截距项相加得到。表 6.1 描述了 J — 1 = 5个响应函数的截 
距的过程。基于表 6.1 展现的结果，这个简单分析的五个响 
应模型分 别是： 

y'(l，0) = 1. 5725 + (—0. 1928) X 性别 
Y '{ 2 , 1) = 0.8688+ ( — 0.1928) X 性别 
Y'O, 2) = 1.0146 十 （一0.1928) X 性别 
$'(4, 3) =-0. 8347 + ( - 0. 1928) X 性别 
Y'(5, 4) =—0.4147 + (—0.1928) X 性别 


表 6.1 J _ 1 = 5个 AC 响应函数的截距 


AC 截距 

算 式 

结果 

ai 

0. 4323 + 1.0592 

1.5275 

CC2 

0. 4323 + 0. 4365 

0. 8688 

CC3 

0. 4323 + 0. 5823 

1. 0146 

04 

0. 4323 + (- 1. 2670) 

— 0. 8347 

a 5 0. 4323 

- [1. 0952 + 0. 4365 + 0. 5823 + (— 1. 2670)] 

-0. 4147 


在这些表达式中，等式左边括号里的值指出相比较的两 
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定序因变量的 logistic 回归模型 


个相邻类别。这些模型可以用来发现对应于各个响应函数 
的依靠于性别的预测 logit ; 预测的 logit 再可以转化以估计 
暗示的两个相邻取值中处于更高类别的概率的比数。估计 
的响应变量 logit 在输出结果的最后一部分给出“响应函数的 
预测值”。观察的 logit 在表的前半部分呈现，例如，为了计算 
男性(性别= 1) 在第四个 AC 比较中的预测 logit (公式4代 
表类别4与类别3相比），我们使用以上的关联响应 模型： 
Y (4, 3) =- 0. 8347 +(— 0.1982) X 性别 =— 0. 8347 + 
(一 0.1982) = 一 1. 0275。我们可以使用同样的过程来得到女 
孩(性别= 0) 的对应预测 logit ： Y = -0. 8347 +(— 0.1982) X 
性别=一 0.8347。如果预测 logit 经过指数化，结果就是对 
于各个性别处在类别4而非类别3的比数。对于男孩， 
exp (— 1. 0275) = 0. 3579,对于女孩则是 exp (— 0. 8347) = 
0. 4340。无论男孩和女孩，落在类别4的概率要小于类别3, 
这与 CO 和 CR 模型的结果类似。为了计算男孩对女孩的比 
数比，我们得到 0. 3579/0. 4340 = 0. 8246,即 AC 模型的性 
别作用的指数值，也等于 exp (- 0.1982) = 0. 8246。对于所 
有的五个 AC 响应函数，性别的作用以一个对应的共同为 
0.8246 的比数比保持一致。因此，根据模型，男孩处于两个 
相邻类别中较高者的比数是女孩比数的 0. 8246 倍; 男孩更 
不大可能处于较高的阅读熟练度水平。 

熟练度的分性别的实际频次和类别概率稍早在第4章 
的表 4.2 中（表格第一、第二行的男性和女性部分）给出。 
AC 模型并不预测类别 概率; 确切地说，从 AC logit 模型中 
得到的预测值可以用来估计两个相比较的相邻类别中更高 
的响应变量的条件概率。然而，预测的 logit 可以转化为比 
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数,再将比数以通常的方式转化成预测 概率： =比 
数/(1+比数）。 

通过使用表 4. 2中的数据，以及 AC 模型的结果，计算岀 
观测的和预测的 AC 概率并在表 6. 2中呈现出来。观测的和 
估计的比数比也在表 6. 2中呈现。概率是以比较的具体相 
邻类别为条件的。例如，男性的第一个条目 0.7725 代表了 
男性处于熟练度1级而非(下一个稍低的)相邻类别，熟练度 
0级的观测概率。该值是由表 4. 2中这两个相邻类别的条目 
所决 定的： 0. 7725 = 163/(48 + 163) 。通过使用表 4. 2中具 
体类别概率也可以得到相同 的值： 0.7725 = 0.0974/ 
(0. 0287 + 0. 0974)。 

从 AC 模型中得出的预测条件概率在表 6. 2的底部给 
出。为了从 logit 模型中得到预测概率，我们使用类似的表达 
式：多 = exp ( logi«)/(l + exp ( logit ))。 对于处于比较(4， 3) 
中的男孩，这就成为彡 4 .男性 = 0.3579/(1 + 0.3579) = 
0.2636,如表 6 . 2中底部的第四列所示。类似的，我们可以 
得到女孩的 = 0. 3026。这些概率是条件的，对应的含 
义是在给定两个相邻类别之中任一条件下它们所对应的处 
于更高类别的概率。最后，从观测到估计比数比的直观比较 
来说，性别作用在 AC 类别间的单个值看起来提供了数据的 
粗略描述。 

总体来看，模型表明性别有助于解释相邻熟练度类别间 
概率的差异。仅有性别的模型是对虚无模型的 改进: 虚无模 
型的残余卡方是 X 〗= 41. 33, p < 0 . 0001 (附录4中的句法 
D 2, 结果未予呈现）。基于性别模型，我们可以以下结论说明 
男孩跟女孩相比更不大可能处于两个相邻类别中较高的阅 
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读熟练度。 


表 6. 2观测到的 ( Jt / )和预测的 （f / ) 条件 AC 概率 


AC Comparison 

(1 ， 0) 

(2, 1) 

(3, 2) 

(4, 3) 

(5, 4) 

<男性 

0. 7725 

0. 6625 

0. 6967 

0. 2580 

0. 3710 

<女性 

0. 8582 

0. 7043 

0. 7316 

0. 3071 

0. 3836 

OR (observed) 

0. 5588 

0. 8245 

0. 8428 

0. 7858 

0. 9474 

/\ 

P /. 男性 

0. 7916 

0. 6629 

0. 6946 

0. 2636 

0. 3526 

P /• 女性 

0. 8216 

0. 7045 

0. 7339 

0. 3026 

0. 3978 

OR (estimated) 

0. 8246 

0. 8246 

0. 8246 

0. 8246 

0. 8246 


因为从模型中估计的概率是条件的，又因为每一个的比 
较基础都不一样，所以并没有估计 AC 模型的特定类别概率 
的直接方法。测量关联的统计量例如 r P 和 A p 用这些类别概 
率来构建分类表。阿格雷斯提 ( Agresti ，1989) 提供了计算 
类别频次的句法和例子，该计算是基于根据基线类别（多分 
类 Mogit 模型的调整和将解释变量的斜率约束为在 AC 响应 
函数间保持一致的特定设计的矩阵结构。这种方法在解释 
变量个数增加时将会变得十分复杂，这里不再叙述。然而， 
在 AC 模型中的实际概率和预测概率之间有很强的关联，皮 
尔森的伽马系数为 0. 997。这个相关是为两个剖面(性别)在 
五个响应模型中而计算的，因此得到这么高的关联系数并不 
奇怪。如稍早提到的， CATMOD 使用加权最小二乘法而非 
极大似然值法来估计 AC 模型; 因此，并不存在一个将之前两 
个定序回归方法比较的似然比茫。 
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第3节 | 两个解释变置的 
相邻类别模型 


CATMOD 过程并不是用来处理连续解释变量的，而且 
独特共变模式在数据集内的样本量很小时估计会出问题。 
之前讨论的全模型 AC 与 C 0 和 CR 模型的等价性由于这个 
限制并不可估。 AC 模型可以通过 GENMOD 过程或者 
SPSS 的 GENLOG 和来自于无约束的多分类模型的调整来 
拟合，但是那些方法与本书呈现的回归方法多少有些不同， 
因此在这里不予考虑。多分类结果的分析细节可以在阿格 
雷斯提 （ Agresti , 1990，1996 )、 Allison ( 1999 ) 、 Borooah 
(2002), Ishii-Kuntz (1994) 以及坦巴克尼克和芬戴尔 
(Tabachnick & Fidell , 2001) 等人的研究中找到。 

为了描述稍复杂的设计 AC 分析的回归方法，本书选取 
了一个连续变量，上幼儿园的年龄 ( plageent ) ，构建了一个二 
变量的模型（入园年龄和性别）。按照克洛格和谢哈德 
(Clogg &. Shihadeh , 1994) 使用的有连续预测变量的 AC 模 
型方法，将年龄划分成四层(年龄类别， agecat )， 开始于57个 
月 （4. 75年），各个跨度约为六个月。各个解释变量(性别和 
年龄类别)都通过子命令“直接”(附录4中的句法 D 3) 来作为 
定量的处理。 
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分析产生了八个共变剖面，两个解释变量的2 X 4个交 
互分类各一个。剖面内部的样本规模从18到850不等。残 
余卡方检验表明模型拟合良好 ， XL = 30.49, p = Q. 5929, 
分析中稍大一点的/>值表明，相对仅有性别的模型有稍微的 
改进。性别 （ Y 的= 42. 06, p< 0 . 0001) 和年龄类别 ( W 的 
= 60. 43, /»<(). 0001) 在模型中都统计显著。 

五个 AC 模型在下面显示。各个模型的截距形成遵循表 
6.1 中勾勒的相同模式。性别作用的比数比是 exp (-0. 2043) 
= 0. 8152,这与之前它在仅有性别的分析中的作用类似。因 
此，控制了入园年龄后，男孩更不大可能比女孩处于两个相 
邻熟练度类别中较高的熟练度水平。年龄对熟练度的比数 
比是 exp (0. 1607) = 1. 1743。控制了性别，年长的儿童与年 
幼儿童相比更有可能在阅读方面处于较高的熟练度类别。 

f '(1 ， 0) = 1.1373 + (-0.2043) X 性别 + (0.1607) X 年龄类别 
Y '(2, 1) = 0. 5544+(-0. 2043) X 性别 + (0.1607) X 年龄类别 
Y’(3, 2) = 0. 6871 + (—0. 2043) X 性别 + (0.1607) X 年龄类别 
Y ， (4, 3) =-1.1718 + (-0.2043) X 性别 + (0.1607) X 年龄类别 
f'(5, 4) =— 0. 767 + (― 0.2043) X 性别 + (0.1607) X 年龄类别 

性别和年龄分类的平行性假设是通过回顾对应于各个 
响应函数潜在的 AC 模型来验证的(分析未予展示）。对于两 
个解释变量，考虑到各个模型推出的 logits 和比数比，这个解 
释似乎是合理的。八个剖面 ( profiles ) 在五个响应函数间的 
观测值和预测值之间的关联很强 ， r = 0. 903。 
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第4节 | 全相邻类别模型分析 

凝: i . 致喚 if 1 兹 S +物 礙 & S ? 上’ . . .. . .. . 


为了提供前两章结果之间的比较，对应的 AC 二分 logis - 
tk 回归是基于整套预测变量的。表 6. 3中展示了结果。粗 
体印刷的比数比统计上显著不同于1。在作用的方向上，结 
果与 C 0 模型和 CR 模型的发现完全一致。总体来说，年长 
的和来自较高社会经济地位家庭的儿童倾向于处于更高的 
阅读熟练类别。男孩如果来自存在所谓的风险因素的家庭 
(见第2章），另外，在某种程度上，仅上半天幼儿园而非全天 
幼儿园的，都倾向于处于较低的熟练度类别。父母没有人经 
常给他们读书的儿童也倾向于处于较低的熟练度类别，该变 
量的比数比也通常小于1,尽管该作用在 AC 模型中统计上 
都不显著。 
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定序 S 变置的 kgistac 回归模型 


第1节 I 本书内容总结 


本书的目的是描述定序因变量变量的统计分析技术，并 
使得实证研究者熟悉定序数据的分析方法，这些数据是忠实 
于结果测量实际水平的。使用来自 NCES 的儿童早期追踪 
研究一幼儿园同期群 ( ECLS - K ) 的数据，可以用三种定序回 
归方法予以 呈现： 比例或者累积比数、连续比数以及相邻类 
别模型。此外，这些模型的一些扩展也得以呈现，允许对一 
些解释变量比例性或者平行性假设的宽松约束。这里描述 
的这些方法和例子使得研究者在他们的研究数据结果以定 
序因变量形式出现时可以使用类似的模型。 

定序因变量的分析方法要求研究者从研究问题出发而 
不是为了拟合某个模型。面对诸多分析的选择，这里提到的 
是最常使用的定序回归方法。以上界定的模型在模型预测 
和解释变量的作用上各不 相同； 因此，模型方法的选择应当 
一直由理论指引，或者是解释变量如何可能影响定序结果， 
或者是定序分数如何推导出来。选择还应当由特定的研究 
目的，以及特定统计模型应用而得到的结果的预期含义加以 
引导。 

克利夫等人 （ Cliff , 1993, 1994, 1996 b ; Cliff &- Keats , 
2003) 坚持将定序变量看成是定序的，也就是要保存变量实 


第 7 章结论 


135 


际形成的过程。他的研究指引了本书大部分关于使用和分 
析定序结果数据的重要思考。然而，本书的目的不是倡导一 
种附会于简单的基于响应变量尺度的方法论。相反，目标是 
在定序分数的解释十分重要时，促进定序技术的理解和 
使用。 

对定序的掌握类型分数的分析，例如从 ECLS - K 数据中 
得到的早期读写熟练度的尺度，试图理解为何一些儿童能够 
成功达到某个早期阅读技能，而其他的儿童未能达到同样的 
技能，而且它也有助于研究者根据儿童所处的熟练度连续体 
找出或者发展出意欲改善个体熟练度的干预方法。试图将 
儿童从最低的熟练度类别上升到任何更高的熟练度的相同 
干预也许并不适用于已经处于两三个最高类别上的儿童。 
定序分数分析在其他领域也有类似的用处。例如，减小风险 
的干预，那些意欲促进安全套使用的措施，对于处于不同计 
划阶段的目标人群经常使用不同的干预信息 （ Prochaska , 
DiClemente et al . , 1992； Stark et al . , 1998)。 因此，一个尺 
寸并不能适合所有定序结果变量的内容。 

在所呈现的例子中有很多作用方向的类似性。例如，那 
些有家庭风险或者没有家长或者监护人为他们读书的一年 
级孩子更不可能比他们的同龄人处于更高的熟练度水平。 
年长的或者来自较高社会经济地位的一年级儿童相比他们的 
同龄人更有可能处于较高的熟练度水平。观察全 CO 模型和 
CR 分析的表格，所有作用的比数比在方向上都是类似的，但 
是比数比的解释要取决于所构建的特定模型。累积比数是用 
来呈现儿童处于或者高于任意特定熟练度类别的比数。连续 
比例是在已知该儿童已经达到该熟练度类别的情况下，用来 
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呈现儿童超过某特定类别的比数。最后， AC 模型是被设计用 
来估计儿童处于两个相邻熟练度水平中较高者的比数。一个 
最重要的问 题是: “这些模型中的哪一个是‘最好的’ ?” 

答案很 简单: 这取决于研究问题。 CO 模型在研究兴趣 
是澄清结果的趋势时尤其有用，无论因变量的不同值是向上 
还是向下的 (Agresti， 1996)。 CR 模型可能在发展类型的研 
究中最有用，研究者的最大兴趣是意欲弄清楚在给定某特定 
阶段已经达到的情况下 （O’Connell，2000) ，与在响应连续体 
上更进一步关联的因素。 AC 模型宣称哪一个预测变量最好 
地预测了处于下一个最高响应类别的响应，因此有助于找出 
在 AC 响应配对之间的差异。 

然而，“最好”的定序模型也将是比例或者平行性假设合 
理的那一个。如本书所呈现的，拟合并观察各个方法相对应 
的二分模型，补充一些对这些假设的检验 CO 和 CR 模型能 
够调整为允许隐含的分割点或者类别区分间的交 互项; 这就 
是偏比例比数模型，也可以成为偏比例风险模型。尽管这两 
种交互模型都要求重构数据集，他们在理解解释变量对响应 
连续体变动的不同作用上仍然非常有用。对于 ECLS-K 研 
究，偏比例风险模型也许最好地呈现了熟练度过程以及与一 
个儿童实际上能够取得更高类别熟练度的可能性相关联的 
因素。 

尽管来自 ECLS-K 数据的定序熟练度分数分析的目标 
也许支持了作者在这个特殊的例子中对连续比例模型的偏 
好，但此处并没有尝试将一个定序回归方法或多或少地置于 
比其他替代方法更合适的位置。每个模型都将不同的假设 
集置于数据之上，并引出不同种类的研究问题。研究者的责 



任就是完全理解这些假设的本质以及选择不同的模型对研 
究发现有用性的可能影响。 

假设数据的测量属性比实际的更强，例如将定序结果的 
值看成是均等间距尺度，则模糊了数据模式的丰富性，这种 
威胁通过专为定序结果设计的方法将得到更好的暴露。第4 
章包括了累积比数模型和多元线性回归模型结果的比较，这 
种直接比较的结果应该传达给研究者这样一种 信号: 依靠熟 
知的方法，例如多元回归分析，会遮盖重要作用的解释并且 
导致毫无道理的预测。另一方面，完全忽视数据的定序性， 
即将结果作为严格的名义变量对待，阻碍了评估方向性和进 
步的能力，而这看起来正是一开始之所以构建定序因变量测 
量的关键。我们希望，研究者们通过使用本书中所呈现的研 
究，能在他们的分析方法中考虑定序回归技术，尤其是当他 
们的问题和数据表明这样的方法正确的时候。 
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第 2 节 I 进一步研究的考虑 


在很多方面，使用定序回归模型仍然是一个发展中的方 
法。针对那些希望今后能够发展并应用定序模型的读者，作 
者提出以下兴 趣点： 

• 这里呈现的关联的测量，包括 r p 和 A p 以及似然比记 
统计量，是很微弱的。这也许是数据的加 工品； 熟练 
度的分布是不均衡的，很大一部分(44%)的儿童在一 
年级一开始就已取得了熟练度为三级的水平。朗 
( Long , 1997) 指出，尽管有必要对概要的统计进行拟 
合，但“在实际中它们是有问题的”，因为它们只提供 
了模型质量的部分信息。霍斯默和莱默苏 (2000) 提出 
了有趣的观 点:从 logistic 回归模型中得出的分类统计 
之所以不合适，是因为分类倾向于被样本分布的概率 
所左右。尽管他们的论断是特指二分模型，扩展到定 
序模型的分类，类似的问题也很明显。无论如何，在 
不同样本中考察定序因变量的关联的不同测量的行 
为能够为这个领域提供很有价值的信息。 

• 考察定序方法的比例性或者平行性假设的做图方法， 
以及残差诊断方法都没有得到很好的发展。 SAS 或 
者 SPSS 都未能在它们的程序中包括定序回归的残差 
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诊断(尽管二者都有对 logistic 回归的）。尽管这里没 
有考察图形和残差的诊断，本德和本纳 （Bender 
Benner, 2000) 展示了他们所考察的定序模型子集的 
若干诊断和做图方法。 

• 这里呈现的方法假设个体间的独立，是用个体水平的 
模型拟合数据。然而， ECLS - K 研究是基于多阶段分 
层抽样策略，从抽中的学校中再抽取儿童。因为本研 
究的目的是详细解说定序回归模型的应用，就没有包 
括数据的多层结构调整。定序数据的多层模型可以 
通过主要的多层软件包来实现,它们 包括: HLM ( Rau - 
denbush , Byrk , Cheong , &- Congdon , 2000), MLwiN 
(Goldstein et al . , 1998)， 以及 MIXOR(Hedeker &- 
Gibbons , 1996)。 HLM 能够拟合多层数据的比例比 
数模型。 MLwiN 能够拟合比例比数模型，并可以通 
过重构数据估计多层 logistic 连续比例模型以及 logis - 
tic 偏或者非比例风险模型。 MIXOR 是专为定序结果 
的多层分析而设计的，它比 HLM 或者 MLwiN 的灵 
活性都要大。关联函数包括 logit 、 probit 以及互补双 
对数。 
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附录1 | 第3章 


“ Gonomiss ” 是兴趣解释变量无缺失观测的子样本 SAS 
数据集。 “ ECLSFGsub ” 是兴趣解释变量无缺失观测的子样 
本 SPSS 数据集。 

Al . SPSS LOGISTIC (对于熟练度结果0, 1 VS . 5) 


** (cixnsp2 = 0 if prof read = 0, 1 ； else cumsp2 = 1 if prof read = 5). 
tonporary. 

select if {profreadle 1 OR prof read eq 5). 
logistic regression C0MSP2 
with GENDER 
/print = all 
/save: pred. 


A 2. SAS PROC LOGISTIC (降序 选项; 其他选项如下) 


** data "go" contains only children with values of 0, 1, or 5 on 
profread ； 

** cumsp2 = 0 if prof read = 0, l_else cumsp2 = 1 if prof read = 5 ； 
proc logistic data = go order = internal descending ； 

model cumsp2 = gender/link - logit lackfit ctable pprob = . 5001 
rsquare ； 

output out = dataprobs pred = phat ； 


附录 
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A 3. SASPROC LOGISTIC (默认为升序 选项; 基本选项) 


" 数据 "go” 仅包括 "profread” 的值为 0, 1 或者 5 的儿童； 

** cumsp2 = 0 if prof read = 0, ljelse cumsp2 = 1 if prof read = 5 ； 
proc logistic data = go order = internal ； 

model curasp2 = gender/link = logit rsquare ； 


A 4. SPSS PLUM 


temporary. 

select if (profreacQe 1 OR prof read eq 5). 

PLUM 

cumsp2 BY gender 
/LINK = logit 

/PRINT = FIT PARAMETER SUMMARY TPARALLEL HISTORY(l) KERNEL 
/SAVE = ESTPROB PREDCAT PCPROB ACPROB. 
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附录2 I 第4章 


Bl . SAS 升序 ( CO 模型），乂1=性别沁6110^) 


proc logistic data = sagebodc. gonomiss ； 

model prof read = gender/link = logit r square ； 
output out = propodds prec^probs = cumulative ； 


B 2. SAS 降序选项 ( CO 模型）， Xl = 性别 ( Gender ) 


proc logistic data = gononiss deseeding ； 
model prof read = gender/rsquare ； 
output out = proppred predprobs - cumulative ； 


B 3. SPSS PLUMCCO 模型），父1=性别(06!«^) 


通过 fiit_$$ 筛选.■•-筛选出含缺失值的个案 
PLUM 

profread BY gender 
/LINK = LOGIT 

/PRINT = FIT PARAMETER SUMMARY TPARALLEL HISTORY (1) KERNEL 
/SAVE = ESTPROB PREDCAT PCPROB ACPROB. 


B 4. SAS 全模型累积比数模型(降序) 


proc logistic data: sagebook. gonomiss descending； 

model prof reed - ggicter famri^c center noreadbo minority halfcfayK 
tdcsesl plageent 

/link = logit rsquare； 

output out - proppred predprobs - cumulative ； 


B 5. 通过 SAS 的 GENMOD 实现的偏比例比数 


•为 了偏比例比数生成重构的数据集 •〃 ； 

data ppom； set gonomiss ； 

do； if prof read = 5 then beyond - 1 ； 
else beyond = 0； split = 5; output； end； 
do； if prof read ge 4 then beyond = 1 ； 
else beyond = 0； split = 4； output； end； 
do； if prof read ge 3 then beyond - 1 ； 
else beyond = 0 ； split = 3; output； end； 
do； if profread ge 2 then beyond = 1 ； 
else beyond = 0； split = 2； output； end； 
do； if profread ge 1 then beyond = 1 ； 
else beyond = 0 ； split - 1 ； output； end； 


proc freq data = ppom； 

tables split* profread * beyond； 


proc sort data = ppom； 

by split gender famrisk center noreadbo minority halfdayK； 


M 使用与单个的 logit 分析最类似的 INDEP 结构； 

** 参见 Stokes，Davis, Koch(2000) ， 第 541 页； 

proc genmod descending order = data data = ppon； 

class split gender famrisk center noreadbo minority halfday 
childid； 

model beyond = gender famrisk center noreadbo minority telfda 评 


wksesl plageent split split* minority 
/link = logit d = b type3； 
repeated subject = childid /type - indep； 








C 2. SAS ： logit 关联连续比例 ( CR ) 模型，使用降序选项 


proc logistic data = concat descending ； 

model beyond = dumcrO dumcrl dumcr2 dumcr3 gender/link = logit 
rsquare ； 

output out = modC2 pred = plat ； 


C 3. SAS : 互补双对数关联连续比例 ( CR ) 模型，使用升序(默 
认)选项 


proc logistic data = concat ； 

model beyond = dumcrO dumcrl duracr2 dumcr3 gender/link = cloglog 
rsquare ； 

output out = modC3 pred = phat ； 


C 4. SAS : 互补双对数关联累积连续比例 （ CR ) 模型,使用升 
序(默认)选项 


proc logistic data = gonooiiss ； 

model prof read = gender/link = cloglog rsquare ； 
output out = raodC4 pred = phat ； 


C 5. SPSS : 互补双对数关联累积连续比例模型 


PLUM 

profread BY male 

/CRITERIA = CIN(95) DELTA(O) LCONVERGE(O) MXITER(IOO) 
MXSTEP(5) 

PC0NVERGE(1.0E-6) SINGUIAR( 1. OE-8) 

/LINK = cloglog 

/PRUTT = FIT PARAMETER SUMMARY TPARALLEL HISTORY ⑴ KERNEL 
/SAVE = ESTPROB PREDCAT PCPROB ACPROB. 
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C 6. SAS ： logistic 连续比例，全模型 


** CRl logit link ； 

proc logistic data = sagebook. concat descending ； 

model beyond - dumcrO dumcrl dumcr2 dumcr3 gender famrisk center 
noreadbo minority halfdayK vrfcsesl plageent 
/link = logit rsquare ； 
output out = modC6 pred = phat ； 


C 7. SPSS : 累积连续比例，全模型 


PLUM 

prof read BY male famrisk center noreadbo minority halfdayk 

wm 

plageent vdcsesl 

/CRITERIA = CIN(95) DELTA(O) LCONVERGE(0) MXITER(IOO) MXSTEP 
(5) 

PC0NVERGE(1.0E-6) SINGULAR 1. OM) 

/LINK = cloglog 

/PRINT = FIT PARAMETER SUMMARY TPARALLEL HISTORY( 1) KERNEL 
/SAVE = ESTPROB PREDCAT(CRpred) PCPROB ACPROB. 


C 8. 在 SPSS 中生成基于从句法 C 2( SAS 降序)得到的模型 
估计的 logistic 连续比例分析的分类表 


*CR logit 模型 P ( 超过 = 1) *********** 

* 使用定序数据集 ， n = 3365™— 

canpute int = — . 3763. 

compute duracrO = 4.4248. 

ccaapute dumcrl = 2. 9113. 

compute dumcr2 = 1.9283. 

ccxnpute durocr3 - 0. 0578. 

compute slopegen= -0. 2865. 

confute logit4 = int + slopegen* gender. 

compute logit3 = int + dumcr3 + slopegen* gender. 

compute logit2 = int + dumcr2 + slopegen* gender. 



confute logitl = int + durocrl + slopegen * gender, 
compute logitO = int + dumcrO + slopegen* gender, 
compute deltaO = exp(logitO)/(1 + exp(logitO)). 
compute deltal = exp(logitl)/(1 + exp(logitl)). 
conpute delta2 = exp(logit2)/(l + exp(logit2)). 
confute delta3 = ejq)(logit3)/(1 + esq)(logit3)). 
compute delta4 = exp (logit41/(1 + (logit4)). 

* freq/var = deltaO deltal delta2 delta3 delta4. 

-**** 现在需要德尔塔的互补以用于降序 logit 关联 **** 
canpute ccxapdO = 1 — deltaO. 

compute ccxnpdl = 1 - deltal. 
compute c<»ipd2 = 1 - delta2. 
compute compd3 = 1 - delta3. 
compute compd4 = 1 - delta4. 
compute compd5 - 1. 0. 

* freq/var - corapdO to compd5. 

* freq/var = pO to p5. 
compute pO = compdO. 
compute pi = corapdl * (1 — pO). 
compute p2 = compd2* (1 - pO - pi). 
compute p3 = ccxnpd3 * (1 - pO - pi - p2). 
compute p4 = compd4 * (1 - pO - pi - p2 - p3). 
compute p5 = compc5* {1 - pO - pi - p2 - p3 - p4). 

〃现在 ，将最大的类别概率作为选择预测的类别值的依据 
compute inaxphat = max{pO, pi, p2, p3, p4, p5). 
compute predcls = 99. 
if(maxphat = pO) predcls = 0. 
if(maxphat - pi) predcls = 1. 
if (maxphat - p2) predcls = 2. 
if (inaxphat = p3) predcls = 3. 
if (inaxphat = p4) predcls = 4. 
if (rna^)hat = p5) predcls = 5. 
freq/var = predcls. 

CROSSTABS 

/TABLES = prof read BY predcls 
/cells = count expected 
/FORMAT = AVALUE TABLES. 




D 1. 相邻类别 ( AC ) 模型 


llbname sagebook "C: \My Documents'research、ordinal new\sagebook\ 
ordinal sas stuff "； 

proc freq data = sagebook. gonomiss ； 
tables plageent prof read* gender ； 


proc catmod data = sagebook. gononiss : 
direct gender ； 

response alogit out = acgender ； 

model profread = _response_ gender/wls pred ； 


proc contents data = acgender ； 


data go ； set acgender ； 
odds = e3q>( - pred _)； 
predprob = odds/(l + odds )； 


proc freq data = go ； 

tables gender* —number—* prectorob ； 




if plageentle 62 then agecat - 1 ； 
if plageent gt 62 AND plageentle 68 then agecat = 2 ； 
if plageent gt 68 AND plageentle 74 then agecat = 3 ； 
if plageent gt 74 then agecat = 4 ； 


proc catmod data = go2； 
direct gender agecat； 
response alogit out = acfull； 

model prof read = —response—gender agecat/wls pred； 


;contents data = acfull： 


data go3； set acfull； 
odds = eaq)(_precL); 
predprob = odds/(l + odds)； 
obsodds = exp{_dbsj\ ； 
obsprob = obsodds/(l + obsodds)； 


: corr data = go3； 
var obsprob predprob； 
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注释 


[1] 进一步了解测量层次问题，请参阅克利夫 (Cliff, 1996b) 以及阿格雷斯 
提和费雷的著作 (Agresti Finlay, 1997 )。 

[2] 取得公共使用的 ECLS-K 数据的更多信息在网上可以査到七 t P :// nc - 
es. ed gov/ecls 0 

[3] 使用的是修改过的熟练度分数 (C1RRPRF1 到 C1RRPRF5, 等等)。 

[4] ECLS-K 熟练度水平遵循一个古特曼模型 (Guttmanmodel), 也就是通 
过某一特定技能的儿童被认为是掌握了所有较低的技能水平。在一 
年级秋季和春季数据中，仅有 5. 5% 的儿童的阅读没有遵循这种模 
式， 6. 6%的儿童的数学没有遵循该模式。 NCES(2002) 报告认为，这 
种模式也许更多是意味着这些学生是猜测的，而非意味着一种不同 
的习得顺序。在 ECLS-K 数据的三年级里，由 NCES 所决定的各个儿 
童最高熟练度分数现在直接包括在数据 集中； 早些时候的数据集，包 
括本书中使用过的，仅包含了二分的熟练程度变量。对于响应模式 
不遵从古特曼模型的小部分学生， NCES 将他们的最高熟练度报告为 
“缺失”。然而，对于这里使用的数据，作者对某一儿童掌握（或者没 
有掌握)某一最高定序熟练度分数的指派是依据记录的 4 题答对 3 题 
的标准。 

[5] 如一位评阅者提出的，将 ECLS-K 数据中得到的定序分数概念化为计 
数的过程也是可能的，也就是 ，一 个计算儿童所通过的熟练度类别的 
个数 (0 到5,对于 ECLS-K 的一年级数据）。计数数据的模型，例如泊 
松或者负二项，也许是本书讨论的定序 logistic 模型的替代方法。然 
而，对于本书中分析的 ECLS-K 数据，这些策略也有一些局限，包括泊 
松过程中事件之间的独立性假设，不同学生间掌握度的同质性假设， 
一年级数据可能数目的上限等。随着三年级数据集的释出，将熟练 
度类别扩展到 13( 包括原始的0到5级熟练度），泊松回归过程的应 
用也许是理解影响儿童学习的因素的另外一种方法。如果能够参考 
朗 （Long, 1997) 等人提到的对泊松回归过程的发展和应用信息中的 
不同的计数过程，那些基于定序数据研究的读者也许能够概念化得 
更好。 

[6] 变异和饱和模型的讨论在这里多少有些简化。实际上，的确有若干定 
义饱和模型的方法，得到不同的变异值。 

[7] 参见霍斯默和莱默苏 (2000:147 — 156) 以获得更多的关于 H-L 测试效 
能的信息，也有关于其他模型拟合检验的讨论。 
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[8] 作为关联的测量， Somers ’ D 既有对称形式也有非对称形式。 SAS 的 
LOGISTIC 过程计算并展示匕,而非 D y . x ，也就是，计算 Somers ’ D 时预 
测概率被作为因变量对待，篇幅原因不再详述该统计量不同形式间的 
差异。细节可以参考利贝特劳 ( Liebetrau ，1983) 、彭和尼科尔斯 (Peng 

Nichols , 2003) 以及彭和苏 (Peng & So , 1998) 等人的研究。 

[9] SPSS 执行的是全似然比检验，而非比例比数假设的分数 检验; 分数检 
验实际上近似于全似然比检验 ( D . Nichols ， 个人通信， 2004) 。 
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译名对照表 


Adjacent Categories (AC) model 相邻类别模型 

model fit assessment 模型拟合评估 

assumption of parallelism 平行性假设 

assumption of proportional or parallel odds 比例的或者平行的比数假设 

Chi-square statistic 卡方统计量 


choice of link and equivalence of two clog-log 关联的选择和两种互补双对 


models 

clog-log link function 
clog-log link model 
conditional probabilities 
conditionally independent 
Continuation Ratio(CR) 
continuation ratio model 
Cumulative Odds (CO) 


数模型的等价 
互补双对数关联函数 
互补双对数关联模型 
条件概率 
条件独立 
连续比例 
连续比例模型 
累积比数 


Directionality of responses and formation of 响应的方向性和连续比例 


continuation ratios 
early childhood longitudinal study 
equal slopes assumption 
equal slopes assumption test 


的形成 

儿童早期追踪研究 
等斜率假设 
等斜率假设检验 


full Adjacent Categories(AC) model 

全相邻类别模型 

full-model analyses 

全模型分析 

Full-model analysis for cumulative odds 

累积比数的全模型分析 

full-model continuation ratio analyses 

全模型连续比例分析 

Generalized Estimating Equations(GEE) 

一般估计方程 

goodness of fit 

拟合优度 

graphical methods 

作图方法 

hazard(s) 

风险 

illness severity categories 

疾病严重度类别 

interval-level 

定距水平 

linearity and proportional odds 

线性和比例比数 

link functions 

关联函数 
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定序因变置的 logistic 回归模型 


logistic regression 

logistic 回归 

Log-Likelihood(LL) 

对数似然 

Maximum Likelihood (ML) estimates 

极大似然估计 

McFadden’s pseudo R2 

麦克法登虚拟 R2 

model fit statistics 

模型拟合统计量 

multilevel structured 

多层次结构化的 

multinomial models 

多分类模型 

Multiple Regression (MR) analysis 

多元回归分析 

nominal-level 

名义水平 

null models 

虚无模型 

odds ratios 

比数比 

ordinal data 

定序数据 

parallel slopes assumption 

平行斜率假设 

Partial Proportional Odds(PPO) model 

偏比例比数模型 

phonemic awareness 

语音语韵觉识 

probabilities of interest 

兴趣概率 

proficiency scores 

熟练度分数 

proportional hazards model 

比例风险模型 

ratio-level 

定比水平 

residual diagnostic 

残差诊断 

Somers’ D 

萨摩的 D 系数 

stages-of-change models 

阶段改变模型 

absolute zero-points 

绝对的零点 



